Quantcast
Channel: Offenes Köln Blog » Marian
Viewing all articles
Browse latest Browse all 26

Unser Analysetool zur Bundestagswahl 2013

$
0
0

Bei der Veranstaltung Wahl.Daten.Helfer stand am vergangenen Wochenende das Ausdenken und Umsetzen von Anwendungen auf Basis von Offenen Daten zur Wahl auf dem Programm. Im “Wahllokal Köln“, dem Coworking Cologne Büro an der Bottmühle in der Kölner Südstadt, waren eine Handvoll aktive versammelt und schraubten an diversen Visualisierungen und Werkzeugen.

Die Stadt Köln hat die Kölner Community schon im Vorfeld darüber informiert, in welcher Form die Wahlergebnisse am Wahlabend zur Verfügung gestellt würden und einige zusätzliche Daten zur Verfügung gestellt. So sind beispielsweise die Geodaten der 800 Kölner Stimmbezirke und die Ergebnisse der Bundestagswahl 2009 (Erststimmen, Zweitstimmen) verfügbar. Passend dazu wurde auch das Ergebnis der Stimmenauszählung auf Ebene der Stimmbezirke veröffentlicht. Ein Novum, denn derart detaillierte Daten über das Wahlverhalten hat die Öffentlichkeit bis dato nie bekommen.

Dass ich ein Faible für die Suche nach Korrelation habe, kann man hier im Blog schon an dem einen oder anderen Beitrag sehen. So wollte ich das Hack-Event am Wahlwochenende auch dafür nutzen, eine Anwendung zu bauen, mit der die feinräumigen Wahldaten auf Ebene der Stimmbezirke nach Korrelationen durchsucht werden können. Zugegeben ist die dabei entstandene Anwendung vielleicht nicht für jeden interessant. Die Analysen, die man damit erstellen kann, könnten jedoch von allgemeinem Interesse sein. Und vielleicht kommt ja der eine oder andere nicht-Statistiker so auf den Geschmack und vertieft sich ein bisschen in die Materie.

Ein Beispiel: Wählt man in der Anwendung für die horizontale Achse den Erststimmenanteil der FDP und für die vertikale Achse den Zweitstimmenanteil der FDP, jeweils von den aktuellen Wahlergebnissen, dann zeigt das resultierende Streudiagramm, wo jedes einzelne Ergebnis eines Stimmbezirks gelegen hat. Punkte, die weit oben liegen, stehen für Stimmbezirke mit den höchsten Zweitstimmenanteilen der FDP. Entsprechend stehen Punkte, die weit rechts liegen, für die Stimmbezirke mit den höchsten Erststimmenanteilen. Folglich stehen Punkte, die oben rechts liegen, für die Stimmbezirke, wo die FDP sowohl viele Erst- als auch Zweitstimmen bekommen hat. Und so sieht das dann aus:

Screenshot 1

 

Der fett hervorgehobene Punkt steht übrigens für einen der beiden Stimmbezirke in Köln-Hahnwald. Es scheint fast, als hätten sich die Wahlberechtigten von Hahnwald verabredet, um uns zu erklären, welche Zielgruppe die FDP (immer) noch anspricht.

Nutzer können selbst entscheiden, welche Kennzahlen in dem Streudiagramm gegenübergestellt werden. Möchte man beispielsweise die Gewinne und Verluste zwischen den Bundestagswahlen von 2009 und 2013 für eine Partei, selbstverständlich wie immer aufgeschlüsselt nach Stimmbezirk, auswerten, geht das ebenfalls. Und so sieht es aus:

Screenshot 2

 

Auch hier ist wieder der Stimmbezirk 20701 in Hahnwald hervorgehoben. Wie man nun sehen kann, hat die FDP praktisch in allen Stimmbezirken verloren, auch in ihrem besten. Während hier 2009 noch über 40 Prozent der Zweitstimmen an die FDP gingen, waren es nun nur noch knapp über 21. Die Punkt aller Stimmbezirke formen dabei eine recht deutliche Diagonale, die anzeigt, dass es hier beinahe so etwas wie eine Gesetzmäßigkeit gibt. Punkte (Stimmbezirke), die von der Diagonale nach oben abweichen, haben gemeinsam, dass hier der Stimmenanteil besonders stark zurück gegangen ist.

Und noch ein drittes Beispiel. Hier stellen wir die Wahlbeteiligung der beiden Bundestagswahlen 2009 und 2013 – je Stimmbezirk – gegenüber.

Screenshot 3

 

Der fette Punkte am unteren Rand, Stimmbezirk 80907, fällt hier unmittelbar ins Auge, und nicht nur, weil er aktuell hervorgehoben ist. Es ist der Stimmbezirk mit der niedrigsten Wahlbeteiligung bei der gestrigen Wahl. Auffällig ist aber auch, dass der Punkt so weit außerhalb der diagonalen Punktwolke liegt, die dadurch entsteht, dass Stimmbezirke mit geringer Wahlbeteiligung 2009 auch bei dieser Wahl wieder zu einer ähnlich geringen Wahlbeteiligung tendiert haben. Nicht so aber Stimmbezirk 80907, denn hier lag die Wahlbeteiligung vor vier Jahren eher im Mittelfeld, bei 64 Prozent. Was ist da passiert, dass der Wert nun bei knapp über 25 Prozent liegt?

Übrigens ist wissenswert, dass Briefwähler aus der Darstellung komplett ausgenommen sind. Briefwähler werden in eigens dafür geführten Stimmbezirken erfasst. Eine Abweichung wie die oben beschriebene bei der Wahlbeteiligung könnte also durch eine hohe Briefwahlbeteiligung zu erklären sein. Leider lässt sich das aber anhand der Daten, die uns vorliegen, nicht nachvollziehen.

Zum Stichwort “Daten”: neben den amtlichen Wahlergebnissen habe ich für die Anwendung wieder mal Daten, die die Stadt Köln bislang nur in Form von PDFs veröffentlicht, zusammen getragen. Die Einwohnerzahlen der Stimmbezirke und die Angaben zum Frauenanteil sowie zum Anteil der verschiedenen Altersgruppen sind aus insgesamt 5 dicken Dokumenten der Stadt (1, 2, 3, 4) in einer CSV-Datei mit den historischen Wahlergebnissen und weiteren Strukturdaten zusammen geflossen.

Jetzt seid Ihr dran. Welche spannenden Gegenüberstellungen und Korrelationen findet Ihr mit dem Analysetool?

Probiert es aus!


Viewing all articles
Browse latest Browse all 26

Latest Images





Latest Images