Eine Twitter-Datenanalyse zeigt: Die Sozialdemokraten twittern für Hipster und die bürgerlichen Parteien hauptsächlich für sich selbst

Eine auf machine-learning basierte Auswertung der Kurzbeschreibungen von Twitter-Followern der Schweizer Parteien stellt deren Social Media Auftritte infrage. Während die Sozialdemokraten vor allem Lifestyle-Begeisterte ansprechen, drehen sich die bürgerlichen Parteien im Kreis. Nur die Liberalen schaffen es Follower aus verschiedenen Bereichen des sozialen Netzwerks für sich zu gewinnen.

Warum ist diese Frau die typische Followerin der Sozialdemokraten? Dieser Artikel beantwortet diese Frage anhand eines auf machine-learning basierten Algorithmus – und findet erstaunliches.


Anhand einer Datenanalyse, welche sich methodisch an den aktuellen Entwicklungen im Bereich des machine-learning orientiert, wurden die Kurzbiografien von rund 100’000 Twitter-Followern der grössten neun Schweizer Parteien ausgewertet. Diese maximal 160 Zeichen lange Profilbeschreibung ergänzt die jeweiligen Twitter-Accounts mit persönlichen Informationen der Follower und wird genutzt, um sich kurz und prägnant zu profilieren. Deswegen eignen sich diese Kurzbeschreibungen besonders gut, um allfällige Unterschiede zwischen verschiedenen Gruppen von Followern zu erkunden.

Politiker und Journalisten auf Twitter überrepräsentiert

In einem ersten Schritt wurden die häufigsten Wörter gesucht, mit denen sich die verschiedenen Follower in den Kurzbeschreibungen jeweils selbst beschreiben (Abbildung 1). Schon diese kurze Analyse zeigt, dass sich 4 von den 10 häufigsten Begriffen um das Thema Politik drehen. Weitere 3 von 10 Wörter haben mit Medien und Journalismus zu tun. Insgesamt können damit 7 von den 10 in den Kurzbeschreibungen am häufigsten verwendeten Wörter zwei verschiedenen Themen zugeordnet werden: Journalismus und Politik.

Die 25 meistgenutzten Wörter in den untersuchten Twitter-Profilbeschreibungen

Abbildung 1: Die 25 häufigsten Wörter welche von den untersuchten Followern aller Parteien für die Selbstpositionierung in den Kurzbeschreibungen verwendet worden sind.

Viele Follower der Parteien scheinen sich mit Wörtern zu beschreiben, welche nahelegen, dass es sich dabei um Politiker und Journalisten handelt. Um zu untersuchen, ob alle Parteien viele Journalisten und Politiker als Follower haben, wurden in einem zweiten Schritt die häufigsten Begriffe in den Kurzbeschreibungen nach Parteien aufgeschlüsselt (Abbildung 2).

Die 50 meistgenutzten Wörter aufgeschlüsselt nach Partei

Abbildung 2: Grösse und Farbe der Wörter richtet sich nach Häufigkeit der Verwendung innerhalb der Kurzbeschreibungen der Follower der jeweiligen Partei. Orange, gross geschriebene Wörter kommen am häufigsten vor. Die Ähnlichkeit der häufigsten Wörter zwischen den Parteien lässt darauf schliessen, dass entweder viele „Journalisten“, „Präsidenten“ und „Politiker“ aus den Städten „Zürich“ und „Bern“ allen politischen Parteien gleichzeitig folgen oder, dass die jeweiligen „Politiker“ jeweils der eigenen Partei folgen.

Auch in der Untersuchung der Kurzbeschreibungen nach Partei kommen diejenigen Wörter am häufigsten vor, welche sich mit den Themen Journalismus und Politik beschäftigen. Allerdings zeichnen sich auch noch feinere Muster ab. Bei der Sozialdemokratischen Partei SP (Abbildung 2, Mitte) erscheint nun beispielsweise das Wort sports unter den häufigsten 6 Begriffen (orange eingefärbt), bei der Schweizerischen Volkspartei SVP das Wort business oder bei der Grünliberalen Partei GLP das Wort music. Es scheint also doch noch weitere relevante Themen in den verschiedenen Kurzbeschreibungen der Partei-Follower zu geben. Um diese zu untersuchen wurden im nächsten Schritt machine-learning Algorithmen angewendet, um zugrundeliegende Themen (Topics) zu identifizieren.

Die berechneten Themen

Insgesamt scheinen 11 Themen in den Kurzbeschreibungen der Follower besonders häufig aufzutreten, wobei Thema 6 sich auf Twitter-Profile im allgemeinen bezieht und daher nicht weiter beachtet werden muss. Die Themen, welche mithilfe eines Structural Topic Models (STM, vgl. Box) berechnet worden sind, zeigen auf, welche Wörter in den Kurzbeschreibungen häufig zusammen vorkommen. Ein Thema (Topic) beinhaltet somit alle Begriffe, die häufig zusammen in den Kurzbeschreibungen verwendet worden sind. Die Abbildung 3 zeigt den Überbegriff der jeweiligen Themen und die wichtigsten vier Wörter pro Thema. Zudem zeigt die Länge der schwarzen Linie, dass das Thema POLITIK am häufigsten und das Thema POLITIKWISSENSCHAFT am seltensten vorkommt. Die seltsam anmutende Form der Wörter ist ein Ergebnis der Berechnungen. Um alle möglichen Formen eines Wortes in die Auswertung miteinbeziehen zu können wurde die englische Stammform der Wörter benutzt (Wortstamm).

Structural Topic Model: Die Themen

Abbildung 3: Zeigt die Anteile der Themen an den untersuchten Kurzbeschreibungen (Linie), den Namen des Themas und die 4 häufigsten Wörter pro Thema. Lesebeispiel: Rund 11% der untersuchten Wörter können dem Thema POLITIK zugeteilt werden (Länge der Linie). Die am häufigsten vorkommenden Wörter innerhalb dieses Themas sind: presid, council, canton, zurich. Die ungewöhnliche Form der Wörter rührt daher, dass alle Grossbuchstaben und Sonderzeichen entfernt worden sind und die Wörter anschliessend jeweils auf Englisch übersetzt und in die Stammform umgewandelt wurden. Das Wort presid steht somit für alle möglichen Deklinationen der Stammform presid.  (Eine detailliertere Auflistung der resultierenden Themen findet sich hier.)

Structural Topic Model: Structural Topic Models versuchen, mit Methoden des machine-learning, die Wörter aus einer Reihe von Dokumenten – hier die Twitter-Kurzbeschreibungen der Partei-Follower – in zugrundeliegende Themen (Topics) zu organisieren. Der verwendete Algorithmus berechnet hierfür die Wahrscheinlichkeiten für jedes Wort, in den Kurzbeschreibungen der Twitter-Profile vorzukommen. Anhand dieser Wahrscheinlichkeiten können die Twitter-Profile dann in verschiedene Gruppen unterteilt werden. Das Ziel einer solchen Analyse ist es somit, die Follower anhand von den so generierten Themen in verschiedene Gruppen aufteilen zu können und den Einfluss der Gruppen auf die (Twitter-)Parteiwahl zu untersuchen. Haben beispielsweise Follower, die in ihrer Kurzbeschreibung viele Wörter aus den Themen POLITIK und LIFESTYLE verwenden, häufiger das Twitter-Profil der SP abonniert oder doch das der SVP?

Thema: POLITIK

Abbildung 4: Die vier zentralen Begriffe zum Thema Politik kommen alle im Profil von Herrn Kläy vor. Präsident, Rat, Kanton und Zürich. Seine Kurzbeschreibung passt also optimal zum Thema POLITIK.


Freilich können auch verschiedene Themen in der selben Kurzbeschreibung vorkommen. Die Abbildung 5 zeigt die Zusammenhänge zwischen den Themen auf. Die eingekreisten Themengruppen 1 bis 4 zeigen Themen, die häufig zusammen in Kurzbeschreibungen vorkommen. Zudem sieht man an den Überlappungen der farbigen Kreise welche Gruppen von Themen statistisch miteinander verknüpft sind und welche nicht. Der gelbe Kreis zeigt beispielsweise, dass Follower welche der Themengruppe 1 zugeteilt werden können häufig Begriffe aus den Themen POLITIK, JOURNALISMUS und VERBÄNDE & ORGANISATIONEN in ihren Kurzbeschreibungen verwenden. Zudem zeigt die Überlappung des gelben mit dem grauen Kreis, dass höchstens noch Begriffe mit dem Thema POLITIKWISSENSCHAFT in den selben Kurzbeschreibungen vorkommen. Hingegen gibt es keine Überlappung von der ersten Themengruppe mit den Themengruppen 3 und 4. Es scheint somit eine relativ abgekoppelte Gruppe von Followern zu geben, welche sich vor allem mit Begriffen aus der ersten Themengruppe beschreiben lässt (POLITIK, JOURNALISMUS und VERBÄNDE & ORGANISATIONEN). Wie der erste Teil der Analyse gezeigt hat, scheint diese Gruppe zudem unter den untersuchten Followern besonders stark vertreten zu sein.

 Die Verknüpfung der Themen innerhalb der Kurzbeschreibungen

Abbildung 5: Follower welche viele Begriffe zum Thema LIFESTYLE in den Kurzbeschreibungen verwendet haben, benutzen oft auch Wörter, welche den Themen LOVE & FRIENDS oder ENTREPRENEURSHIP zugeteilt werden können. Etwas weniger stark und doch nachweisbar ist zudem die Verknüpfung von Begriffen zum Thema LIFESTYLE mit den Themen der Themengruppe 4 (SOCIAL MEDIA & MARKETING, KOMMUNIKATION & MEINUNG und BERUF & INNOVATION). Hingegen ist die Verknüpfung der Themen LIFESTYLE und POLITIK sehr selten und statistisch nicht nachweisbar (keine Korrelation).

Wie sind die Themen mit den Parteien verknüpft?

Der Vorteil in der Anwendung des Structural Topic Models im Vergleich zu ähnlichen Methoden ist, dass die Struktur der untersuchten Wörter analysiert werden kann. In diesem Fall bedeutet das, dass die Follower nach der Partei welcher sie jeweils folgen aufgeteilt werden können. So lässt sich herausfinden ob das Vorkommen von einzelnen Themen in den Kurzbeschreibungen Einfluss auf die Entscheidung hat, welchen Parteien die einzelnen Follower folgen. Tatsächlich gibt es diesbezüglich statistisch relevante Unterschiede wie die Abbildungen 6 zeigt.

Themengruppen und Parteien

Abbildung 6: Erwartete Häufigkeit der Themen: Je höher der Wert desto öfter kommt das Thema in den Kurzbeschreibungen der Follower der jeweiligen Parteien vor. Die Wörter und Begriffe aus der Themengruppe 1 (vgl. Abbildung 5) werden von Followern der bürgerlichen Parteien am häufigsten verwendet. Die SP (und zum Teil die LEGA und EVP) mobilisiert auf Twitter eher Follower der dritten Themengruppe. Die liberalen Parteien schneiden in der vierten Themengruppe deutlich besser ab als die bürgerlichen Parteien.

Wenn die Follower in ihrer Kurzbeschreibungen häufig Wörter aus der Themengruppe 1 (POLITIK, JOURNALISMUS und VERBÄNDE) verwenden, folgen sie wahrscheinlich eher den bürgerlichen Parteien. Hingegen ist die SP für Follower interessant, welche in ihren Kurzbeschreibungen viele Begriffe aus der Themengruppe 2 (LIFESTYLE, LOVE & FRIENDS und ENTREPRENEURSHIP) verwenden. Die Grünen, die GLP und die FDP punkten hingegen eher bei Leuten, welche auf Twitter vorwiegend berufsbezogene Kurzbeschreibungen verwenden. Weiter zeigt die Abbildung 6, dass die bürgerlichen Parteien (Bürgerlich-Demokratische Partei, Christlichdemokratische Volkspartei und die Liberalen) viele Follower haben, welche sich mit Begriffen zum Thema VERBÄNDEN & ORGANISATIONEN schmücken. Die SVP, BDP und die CVP haben zudem weniger Follower, die sich selbst mit Wörtern zum Thema SOCIAL MEDIA & MARKETING beschreiben.

Thema: VERBÄNDE & ORGANISATIONEN

Abbildung 7: Eine typische Followerin zum Thema VERBÄNDE & ORGANISATIONEN.

 Fazit

Die Analyse der Twitter -Kurzbeschreibungen erweist sich als durchaus sinnvolles Mittel, um Follower zu kategorisieren. Insgesamt stellt sich allerdings die Frage, ob der Social Media Auftritt der Parteien zielführend ist. Der grösste Teil der Partei-Follower entpuppt sich als Journalisten und Politiker aus den verschiedenen Kantonen der Schweiz. Bürgerliche Politiker beweihräuchern sich auf Twitter selbst, indem sie den grössten Teil der Follower der eigenen Parteien auf Twitter ausmachen. Auch haben viele Mitglieder von Verbänden und Organisationen Twitter-Profile um, wohl auch nicht ganz uneigennützig,

am häufigsten den bürgerlichen Parteien zu folgen. Die Sozialdemokraten sprechen zwar eine etwas breitere Anhängerschaft an, diese verwenden allerdings Begriffe in ihren Kurzbeschreibungen, die nicht wirklich auf politisches Interesse schliessen lassen. Die Grünen und die GLP sind die einzigen Parteien, welche Anhänger mit Kurzbeschreibungen zu fast allen Themen gewinnen können ohne dass der grösste Teil ihrer Follower entweder aus Politikern und Journalisten oder aus Hipstern besteht.

 

Methoden: Die Informationen zu den Followern wurden zwischen dem 14. April und dem 05. Mai 2018 mit Hilfe der Statistik-Software R heruntergeladen und mit Beihilfe der Übersetzungsplattform DeepL auf Englisch übersetzt. Die weiterführende Textbearbeitung und das Rechnen des Structural Topic Models fanden ebenfalls mit Hilfe von R statt.

Viele Bots und inaktive Profile: Spätestens seit den Parlamentswahlen im Jahr 2011 sind die meisten Schweizer Parteien auf Twitter vertreten. Eine Untersuchung von Prof. Simon Hegelich von der TU München aus dem Jahr 2016 zeigt allerdings, dass zwischen 15 und 40 Prozent der Follower der grössten vier Schweizer Parteien Bots beziehungsweise inaktive Nutzer sind. Auch von den rund 100’000 Profilen, welche heute den grössten neun Parteien folgen, haben nur knapp 37’000  ihre Kurzbeschreibung überhaupt ausgefüllt. Eine ausgefüllte Kurzbeschreibung ist zwar ein Indiz dafür, dass das Profil auch aktiv genutzt wird, der Umkehrschluss, dass rund 60% der Follower inaktiv sind, wäre jedoch falsch. Diese Analyse setzt den Fokus auf alle, welche die Kurzbeschreibung ausgefüllt haben. Die Annahme dahinter ist, dass diese Follower aktives Interesse daran haben sich auf Twitter selbst zu profilieren und somit für diese Analyse perfekt geeignet sind.

Limitationen: Die Validität dieser Untersuchung kann nicht grösser sein, als die Validität der einzelnen Kurzbeschreibungen welche hier untersucht wurden.

Dokumentation: Die Dokumentation der Analyse findet sich im folgenden R-Script: Code.txt

Zum Autor:

Titel: Eine Twitter-Datenanalyse zeigt: Die Sozialdemokraten twittern für Hipster und die bürgerlichen Parteien hauptsächlich für sich selbst
Name: Mauro Giovanoli
E-Mail: mauro.giovanoli@uzh.ch
Matrikel-Nr: 14-736-144
Abgabetermin: 27.05.2018
Veranstaltung: Forschungsseminar Politischer Datenjournalismus, Universität Zürich
Dozierende: Prof. Dr. Fabrizio Gilardi, Dr. Bruno Wüest, Alexandra Kohler
Wörter:  1108

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

This site uses Akismet to reduce spam. Learn how your comment data is processed.