Eine auf machine-learning basierte Auswertung der Kurzbeschreibungen von Twitter-Followern der Schweizer Parteien stellt deren Social Media Auftritte infrage. Während die Sozialdemokraten vor allem Lifestyle-Begeisterte ansprechen, drehen sich die bürgerlichen Parteien im Kreis. Nur die Liberalen schaffen es Follower aus verschiedenen Bereichen des sozialen Netzwerks für sich zu gewinnen.
Anhand einer Datenanalyse, welche sich methodisch an den aktuellen Entwicklungen im Bereich des machine-learning orientiert, wurden die Kurzbiografien von rund 100’000 Twitter-Followern der grössten neun Schweizer Parteien ausgewertet. Diese maximal 160 Zeichen lange Profilbeschreibung ergänzt die jeweiligen Twitter-Accounts mit persönlichen Informationen der Follower und wird genutzt, um sich kurz und prägnant zu profilieren. Deswegen eignen sich diese Kurzbeschreibungen besonders gut, um allfällige Unterschiede zwischen verschiedenen Gruppen von Followern zu erkunden.
Politiker und Journalisten auf Twitter überrepräsentiert
In einem ersten Schritt wurden die häufigsten Wörter gesucht, mit denen sich die verschiedenen Follower in den Kurzbeschreibungen jeweils selbst beschreiben (Abbildung 1). Schon diese kurze Analyse zeigt, dass sich 4 von den 10 häufigsten Begriffen um das Thema Politik drehen. Weitere 3 von 10 Wörter haben mit Medien und Journalismus zu tun. Insgesamt können damit 7 von den 10 in den Kurzbeschreibungen am häufigsten verwendeten Wörter zwei verschiedenen Themen zugeordnet werden: Journalismus und Politik.
Die 25 meistgenutzten Wörter in den untersuchten Twitter-Profilbeschreibungen
Viele Follower der Parteien scheinen sich mit Wörtern zu beschreiben, welche nahelegen, dass es sich dabei um Politiker und Journalisten handelt. Um zu untersuchen, ob alle Parteien viele Journalisten und Politiker als Follower haben, wurden in einem zweiten Schritt die häufigsten Begriffe in den Kurzbeschreibungen nach Parteien aufgeschlüsselt (Abbildung 2).
Die 50 meistgenutzten Wörter aufgeschlüsselt nach Partei
Auch in der Untersuchung der Kurzbeschreibungen nach Partei kommen diejenigen Wörter am häufigsten vor, welche sich mit den Themen Journalismus und Politik beschäftigen. Allerdings zeichnen sich auch noch feinere Muster ab. Bei der Sozialdemokratischen Partei SP (Abbildung 2, Mitte) erscheint nun beispielsweise das Wort sports unter den häufigsten 6 Begriffen (orange eingefärbt), bei der Schweizerischen Volkspartei SVP das Wort business oder bei der Grünliberalen Partei GLP das Wort music. Es scheint also doch noch weitere relevante Themen in den verschiedenen Kurzbeschreibungen der Partei-Follower zu geben. Um diese zu untersuchen wurden im nächsten Schritt machine-learning Algorithmen angewendet, um zugrundeliegende Themen (Topics) zu identifizieren.
Die berechneten Themen
Insgesamt scheinen 11 Themen in den Kurzbeschreibungen der Follower besonders häufig aufzutreten, wobei Thema 6 sich auf Twitter-Profile im allgemeinen bezieht und daher nicht weiter beachtet werden muss. Die Themen, welche mithilfe eines Structural Topic Models (STM, vgl. Box) berechnet worden sind, zeigen auf, welche Wörter in den Kurzbeschreibungen häufig zusammen vorkommen. Ein Thema (Topic) beinhaltet somit alle Begriffe, die häufig zusammen in den Kurzbeschreibungen verwendet worden sind. Die Abbildung 3 zeigt den Überbegriff der jeweiligen Themen und die wichtigsten vier Wörter pro Thema. Zudem zeigt die Länge der schwarzen Linie, dass das Thema POLITIK am häufigsten und das Thema POLITIKWISSENSCHAFT am seltensten vorkommt. Die seltsam anmutende Form der Wörter ist ein Ergebnis der Berechnungen. Um alle möglichen Formen eines Wortes in die Auswertung miteinbeziehen zu können wurde die englische Stammform der Wörter benutzt (Wortstamm).
Structural Topic Model: Die Themen
Structural Topic Model: Structural Topic Models versuchen, mit Methoden des machine-learning, die Wörter aus einer Reihe von Dokumenten – hier die Twitter-Kurzbeschreibungen der Partei-Follower – in zugrundeliegende Themen (Topics) zu organisieren. Der verwendete Algorithmus berechnet hierfür die Wahrscheinlichkeiten für jedes Wort, in den Kurzbeschreibungen der Twitter-Profile vorzukommen. Anhand dieser Wahrscheinlichkeiten können die Twitter-Profile dann in verschiedene Gruppen unterteilt werden. Das Ziel einer solchen Analyse ist es somit, die Follower anhand von den so generierten Themen in verschiedene Gruppen aufteilen zu können und den Einfluss der Gruppen auf die (Twitter-)Parteiwahl zu untersuchen. Haben beispielsweise Follower, die in ihrer Kurzbeschreibung viele Wörter aus den Themen POLITIK und LIFESTYLE verwenden, häufiger das Twitter-Profil der SP abonniert oder doch das der SVP?
Thema: POLITIK
Freilich können auch verschiedene Themen in der selben Kurzbeschreibung vorkommen. Die Abbildung 5 zeigt die Zusammenhänge zwischen den Themen auf. Die eingekreisten Themengruppen 1 bis 4 zeigen Themen, die häufig zusammen in Kurzbeschreibungen vorkommen. Zudem sieht man an den Überlappungen der farbigen Kreise welche Gruppen von Themen statistisch miteinander verknüpft sind und welche nicht. Der gelbe Kreis zeigt beispielsweise, dass Follower welche der Themengruppe 1 zugeteilt werden können häufig Begriffe aus den Themen POLITIK, JOURNALISMUS und VERBÄNDE & ORGANISATIONEN in ihren Kurzbeschreibungen verwenden. Zudem zeigt die Überlappung des gelben mit dem grauen Kreis, dass höchstens noch Begriffe mit dem Thema POLITIKWISSENSCHAFT in den selben Kurzbeschreibungen vorkommen. Hingegen gibt es keine Überlappung von der ersten Themengruppe mit den Themengruppen 3 und 4. Es scheint somit eine relativ abgekoppelte Gruppe von Followern zu geben, welche sich vor allem mit Begriffen aus der ersten Themengruppe beschreiben lässt (POLITIK, JOURNALISMUS und VERBÄNDE & ORGANISATIONEN). Wie der erste Teil der Analyse gezeigt hat, scheint diese Gruppe zudem unter den untersuchten Followern besonders stark vertreten zu sein.
Die Verknüpfung der Themen innerhalb der Kurzbeschreibungen
Wie sind die Themen mit den Parteien verknüpft?
Der Vorteil in der Anwendung des Structural Topic Models im Vergleich zu ähnlichen Methoden ist, dass die Struktur der untersuchten Wörter analysiert werden kann. In diesem Fall bedeutet das, dass die Follower nach der Partei welcher sie jeweils folgen aufgeteilt werden können. So lässt sich herausfinden ob das Vorkommen von einzelnen Themen in den Kurzbeschreibungen Einfluss auf die Entscheidung hat, welchen Parteien die einzelnen Follower folgen. Tatsächlich gibt es diesbezüglich statistisch relevante Unterschiede wie die Abbildungen 6 zeigt.
Themengruppen und Parteien
Wenn die Follower in ihrer Kurzbeschreibungen häufig Wörter aus der Themengruppe 1 (POLITIK, JOURNALISMUS und VERBÄNDE) verwenden, folgen sie wahrscheinlich eher den bürgerlichen Parteien. Hingegen ist die SP für Follower interessant, welche in ihren Kurzbeschreibungen viele Begriffe aus der Themengruppe 2 (LIFESTYLE, LOVE & FRIENDS und ENTREPRENEURSHIP) verwenden. Die Grünen, die GLP und die FDP punkten hingegen eher bei Leuten, welche auf Twitter vorwiegend berufsbezogene Kurzbeschreibungen verwenden. Weiter zeigt die Abbildung 6, dass die bürgerlichen Parteien (Bürgerlich-Demokratische Partei, Christlichdemokratische Volkspartei und die Liberalen) viele Follower haben, welche sich mit Begriffen zum Thema VERBÄNDEN & ORGANISATIONEN schmücken. Die SVP, BDP und die CVP haben zudem weniger Follower, die sich selbst mit Wörtern zum Thema SOCIAL MEDIA & MARKETING beschreiben.
Thema: VERBÄNDE & ORGANISATIONEN
Fazit
Die Analyse der Twitter -Kurzbeschreibungen erweist sich als durchaus sinnvolles Mittel, um Follower zu kategorisieren. Insgesamt stellt sich allerdings die Frage, ob der Social Media Auftritt der Parteien zielführend ist. Der grösste Teil der Partei-Follower entpuppt sich als Journalisten und Politiker aus den verschiedenen Kantonen der Schweiz. Bürgerliche Politiker beweihräuchern sich auf Twitter selbst, indem sie den grössten Teil der Follower der eigenen Parteien auf Twitter ausmachen. Auch haben viele Mitglieder von Verbänden und Organisationen Twitter-Profile um, wohl auch nicht ganz uneigennützig,
am häufigsten den bürgerlichen Parteien zu folgen. Die Sozialdemokraten sprechen zwar eine etwas breitere Anhängerschaft an, diese verwenden allerdings Begriffe in ihren Kurzbeschreibungen, die nicht wirklich auf politisches Interesse schliessen lassen. Die Grünen und die GLP sind die einzigen Parteien, welche Anhänger mit Kurzbeschreibungen zu fast allen Themen gewinnen können ohne dass der grösste Teil ihrer Follower entweder aus Politikern und Journalisten oder aus Hipstern besteht.
Methoden: Die Informationen zu den Followern wurden zwischen dem 14. April und dem 05. Mai 2018 mit Hilfe der Statistik-Software R heruntergeladen und mit Beihilfe der Übersetzungsplattform DeepL auf Englisch übersetzt. Die weiterführende Textbearbeitung und das Rechnen des Structural Topic Models fanden ebenfalls mit Hilfe von R statt.
Viele Bots und inaktive Profile: Spätestens seit den Parlamentswahlen im Jahr 2011 sind die meisten Schweizer Parteien auf Twitter vertreten. Eine Untersuchung von Prof. Simon Hegelich von der TU München aus dem Jahr 2016 zeigt allerdings, dass zwischen 15 und 40 Prozent der Follower der grössten vier Schweizer Parteien Bots beziehungsweise inaktive Nutzer sind. Auch von den rund 100’000 Profilen, welche heute den grössten neun Parteien folgen, haben nur knapp 37’000 ihre Kurzbeschreibung überhaupt ausgefüllt. Eine ausgefüllte Kurzbeschreibung ist zwar ein Indiz dafür, dass das Profil auch aktiv genutzt wird, der Umkehrschluss, dass rund 60% der Follower inaktiv sind, wäre jedoch falsch. Diese Analyse setzt den Fokus auf alle, welche die Kurzbeschreibung ausgefüllt haben. Die Annahme dahinter ist, dass diese Follower aktives Interesse daran haben sich auf Twitter selbst zu profilieren und somit für diese Analyse perfekt geeignet sind.
Limitationen: Die Validität dieser Untersuchung kann nicht grösser sein, als die Validität der einzelnen Kurzbeschreibungen welche hier untersucht wurden.
Dokumentation: Die Dokumentation der Analyse findet sich im folgenden R-Script: Code.txt
Zum Autor: