Parteien und Verbände: Wer ist sich am ähnlichsten?

Alle aktiven Akteure, die in der schweizerischen Politik mitmischen, publizieren zu laufenden Geschäften des Bundesrates und der beiden Räte ihre jeweiligen Positionen und Meinungen durch Medienmitteilungen. In diesem Artikel werden die Mitteilungen der grössten Parteien und Verbände miteinander verglichen. Dabei treten teils überraschende Resultate auf. 

Eine vergleichende Analyse von Medienmitteilungen zwischen allen grossen Parteien (SVP, SPS, CVP, FDP, GPS) und den bekanntesten Verbänden (Travail Suisse, Schweizerischer Gewerkschaftsbund, Economie Suisse, Schweizerischer Gewerbeverband, Swiss Banking und Schweizerischer Bauernverband) mit Werkzeugen zur Verarbeitung natürlicher Sprache führt zu sehr schönen Resultaten. Zur Analyse werden von jedem einzelnen der 7400 Texte die Worte durch ein Textverarbeitungsprogramm analysiert, um die Medienmitteilungen aller Akteure so genau wie möglich untersuchen zu können. Damit ist es möglich die häufigsten Substantive, Adjektive, Verben und anderen Wortarten aus den über 1,5 Millionen n-Grams von jedem Akteur zu identifizieren und zu registrieren. Dies erlaubt es mit verschiedenen Algorithmen Schlüsselwörter aus diesen Texten herauszufiltern. Zum Schluss werden diese Resultate jeweils in einen Vektor verpackt und mit der Jaccard-Distanz Formel miteinander auf ihre Gleichheit  überprüft. Diese misst die Ähnlichkeit von zwei oder mehr Dokumenten zueinander.

Grafik 1: Diese Heatmap zeigt wie ähnlich sich, die in der Grafik genannten Parteien und Verbände anhand eine Jaccard-Gleichheitsanalyse sind. In dieser Abbildung gilt, dass die Gleichheit von gelb über orange zu rot zunimmt. Die in der diagonalen liegenden, schwarzen Felder entsprechen dem Vergleich des Akteurs mit sich selber.

Die Resultate aus der Analyse sind in der oben abgebildeten Heatmap zu sehen. Die Grafik spiegelt die Gleichheit der Akteure durch die Jaccard Formel wieder. Dies geschieht anhand der gemittelten Werte für die 500 meist genannten Adjektive und Substantive , sowie der 500 wichtigsten Schlüsselwörter. Die schwarzen Quadrate entsprechen dem Vergleich der Medienmitteilungen jedes Akteurs mit sich selbst. Alle anderen Felder spiegeln die Gleichheit zwischen dem Akteur auf der X-Achse mit dem Akteur auf der Y-Achse wieder. Dies führt zu einer symmetrischen Matrix, die sich durch die Diagonale spiegeln lässt. Dabei gilt je röter und dunkler ein Feld ist, desto ähnlicher sind sich die zwei Akteure.

Als erstes sticht ins Auge, dass sich die Parteien hinsichtlich ihrer Medienmitteilungen ähnlicher sind als ihnen wohl lieb ist, da alle Parteien mindestens um die 15 % Ähnlichkeit untereinander erreichen. Gleichwohl zeigt sich hier ein Bild, welches genauso zu erwarten war. So weist die SVP die geringste Ähnlichkeit mit den Sozialdemokraten und den Grünen auf, doch auch nicht besonders hohe Werte mit der CVP und FDP. Dies demonstriert, dass sich die SVP auch in ihren Medienmitteilungen so gut als möglich vom Rest der Parteien abzusetzen versucht, um weiterhin argumentieren zu können, nicht Teil der Classe Politique zu sein.

Nebenbei kristallisiert sich auch das allseits bekannte Links Rechts Gefälle heraus. So sind die Sozialdemokraten den Grünen am ähnlichsten, wobei diese dann wiederum den Christdemokraten am ähnlichsten sind, gefolgt von den Sozialdemokraten. Die Christdemokraten sind sich wiederum am ähnlichsten mit den Liberalen der FDP. Überdies zeigt sich, dass die schweizerische Volkspartei weiter von ihrem nächsten Nachbarn der FDP entfernt ist, als dies bei den Sozialdemokraten zu den Grünen der Fall ist.

Bei den Verbänden stechen sofort die niedrigen (um 5 %) Jaccard-Werte des Swiss Banking Verbandes ins Auge. Was nicht weiter erstaunlich ist, da sich dieser ausschliesslich zu politischen Geschäften äussert, die Finanzdienstleister direkt betreffen. Daher hat dieser Verband einzig zur Economie Suisse eine höhere Ähnlichkeit, da dieser als Dachverband der Wirtschaftsunternehmen der Schweiz auch ihre Interessen vertritt.

Interessantes spielt sich auch zwischen dem Bauernverband und den Parteien ab. So ist der Bauernverband nicht etwa am ähnlichsten zur SVP oder CVP, welche viele Parlamentarier stellen, die selbst Bauern sind, sondern zu der Grünen Partei. Handelt es sich hier nur um thematische Übereinstimmungen mit unterschiedlichen Wertevorstellungen oder stimmen diese auch überein? Um diese Frage etwas zu klären, betrachten wir die folgende Grafik mit den 15 wichtigsten Schlüsselwörtern von RAKE (Rapid Automatic Keyword Extraction) die sich die beiden Parteien jeweils mit dem Bauernverband teilen. In der Grafik finden sich nicht viele Schlüsselwörter, die von allen drei Akteuren gemeinsam geteilt werden. Nichtsdestotrotz zeigt die Grafik, warum die Ähnlichkeit zwischen dem Bauernverband und den Grünen höher ist als mit der der SVP. Die Grünen publizieren vor allem gemeinsam mit dem Bauernverband zu Themen, die sich um Massnahmen zum Schutz der Konsumentinnen und der Umwelt drehen. Diese Themen sind sicherlich auch für die Bauern sehr wichtig, da sie gegenüber dem Ausland auf Schutz angewiesen sind, um die Preisstabilität ihrer Produkte weiterhin zu gewährleisten. Die SVP hingegen setzt sehr stark auf Themen wie Migration, Aussen- und Finanzpolitik. Daher ist der Gleichheitswert mit dem Bauernverband tiefer, da diese Themen für den Bauernverband nur eine untergeordnete Rolle spielen, auch wenn der Bauernverband hier die konservativen Wertvorstellungen der SVP teilt. Darüber hinaus besitzen die Grünen auch mehr Schlüsselwörter, die sie mit dem Bauernverband gemeinsam haben, als dieser mit der SVP.

Grafik 2: Diese zwei Balkendiagramme zeigen die 15 wichtigsten Schlüsselwörter die der Bauernverband links mit der schweizerischen Volkspartei und rechts mit der grünen Partei gemeinsam hat. Die Grünen besitzen etwa 25% mehr gemeinsame Schlüsselwörter mit dem Bauernverband als die SVP.

Nebenbei zeigen sich in der Heatmap aber die erwarteten höheren Jaccard-Werte zwischen den Arbeitnehmerverbänden (Travail Suisse & Gewerkschaftsbund) und den Sozialdemokraten sowie den Grünen. Hinzu kommen auch höhere Jaccard-Werte zwischen dem Gewerbeverband und der FDP, sowie ein hoher Wert zwischen den verschiedenen Wirtschaftsverbänden, die in der Regel Arbeitgeber vertreten und daher etwas höhere Jaccard Werte mit der FDP, CVP und SVP haben als mit der SPS und den Grünen. Vor allem weisen die Economie Suisse und die Bankiersvereinigung einen besonders hohen Wert bezüglich des Jaccard-Wertes untereinander auf. Dies ist durchaus ein Indiz dafür, dass die Unternehmen aus dieser Branche viel Gewicht innerhalb der Economie Suisse besitzen, im Gegensatz hat die Bankiersvereinigung keine so grossen Übereinstimmungs-Wert mit dem Gewerbeverband, der eher für kleinere und mittlere Unternehmen von Bedeutung ist.

Vor allem aber zeigt die Textanalyse, dass die Parteien stark auf ihr Publikum ausgerichtete Stellungsnahmen verfassen und sich voneinander abzugrenzen versuchen. Dies gelingt aber nicht allen gleich gut. Hier zeigt sich einmal mehr, dass es vor allem die SVP ist, die sich vom Rest besser abzusetzen vermag.

Gleichzeitig verdeutlicht die Analyse, den Unterschied zwischen den Parteien und den Verbänden. Verbände sind viel einseitiger orientiert als Parteien, da sie nach den Resultaten der Analyse nur mit wenigen anderen Akteuren grössere Übereinstimmungswerte erreichen und mit den ihnen nicht so nahe stehenden Akteuren in der Regel wesentlich niedrigere Übereinstimmungswerte erzielen, als dies unter Parteien der Fall ist. Dies verdeutlicht warum es so viele verschiedene Verbände in der Schweiz gibt. Jede grössere Gruppe von Personen oder Unternehmen, welche viel gemeinsam haben, können so gezielt Forderungen und Ziele publizieren, um auf das Schaffen des Bundesrates und der Parlamente Einfluss zu nehmen.

Methodische Anmerkungen

Für die Analyse wurden alle Medienmitteilungen der Akteure direkt von ihrer jeweiligen Internetseite durch ein Skript als JSON-Datei heruntergeladen und anschliessend zu einem Datensatz zusammengeführt.

Der Datensatz wurde daraufhin durch ein Textverarbeitungsprogramm mit R bearbeitet. Das Resultat dieses Prozesses ist ein Datensatz, welcher für jedes Wort eine Zeile vorsieht mit Informationen zum jeweiligen Wort und der Position im Text. Diese beinhaltet Angaben zum Wort Typ, Tempus, Fall und dem Wortstamm des untersuchten Wortes.

Dieser Korpus ermöglicht es die verschiedenen weiterführenden Analysen durchzuführen. Das heisst, es wurden jeweils die häufigsten Substantive und Adjektive aus allen Medienmitteilungen jedes Akteures herausgesucht und in eine Tabelle transferiert. Zudem wurden die wichtigsten Schlüsselwörter aus den Texten der Akteure mit Hilfe des rapid automated keywords extraction Algorithmus herausgesucht (Rose et al. 2010). Für die genaue Funktionsweise lesen sie den Artikel von Rose et al. (2010), da dies hier den Rahmen der Arbeit sprengen würde.

Mit diesen drei Datensätzen wurden dann die Akteure mit der Jaccards Distanz Formel auf ihre Ähnlichkeit hin untersucht. Dieser Index wird sehr oft verwendet um Texte auf ihre Gleichheit, Ungleichheit und Distanz hin zu untersuchen. Die Gleichheit berechnet sich durch die Anzahl gleicher Wörter zweier Einheiten geteilt durch die totale Anzahl an Wörtern der beiden Einheiten (Niwattanakul et al. 2013).

Dieses Verfahren wurde zwischen allen Akteuren durchgeführt was eine Matrix als Resultat zur Folge hat, welche dann relativ leicht als Heatmap dargestellt werden kann. Für die Grafik in dieser Arbeit wurden die Resultate der drei Vergleiche (Adjektive, Substantive und Schlüsselwörter) zusammen gemittelt und erst dann grafisch dargestellt.

Informationen zum Blogbeitrag

Verfasser: Maël Kubli, Matr. Nr: 10-929-297 | mael.kubli@uzh.ch

Abgabe am 27.05.2018 im Rahmen des Forschungsseminars Politischer Datenjournalismus (Frühjahrssemester 2018)

Dozierende: Prof. Dr. Fabrizio Gilardi, Dr.  Bruno Wüest und Alexandra Kohler

Wort-Anzahl (excl. Lead, Anhänge und Literaturverzeichnis): 996

 

Bibliographie 

Niwattanakul, Suphakit, Jatsada Singthongchai, Ekkachai Naenudorn, and Supachanun Wanapu. 2013. “Using of Jaccard Coefficient for Keywords Similarity.” International MultiConference of Engineers and Computer Scientists I(March): 380–84.

Rose, Stuart, Dave Engel, Nick Cramer, and Wendy Cowley. 2010. “Automatic Keyword Extraction from Individual Documents.” Text Mining: Applications and Theory (March): 1–20.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .