MIT MATHEMATIK DIE WAHLERGEBNISSE DES IRAN UNTERSUCHEN WISSENSCHAFT | SMITHSONIAN - ARTIKEL, BLOGS, ÜBERRASCHENDE WISSENSCHAFT, WISSENSCHAFT, MENSCHLICHES VERHALTEN

Statistiker und Politikwissenschaftler haben Anfang dieses Monats einen Feldtag mit den Ergebnissen der iranischen Wahlen verbracht. Wurde die Wahl manipuliert? Wir werden es vielleicht nie erfahren, aber es ist genug in der Mathematik vergraben, um uns glauben zu lassen, dass es so gewesen sein könnte. Aber auch dann gibt es genug, um uns glauben zu machen, dass alles legitim ist. Hier einige Analysen, die ich besonders interessant fand:

Daten bereinigen

Unmittelbar nach der Wahl wurden Zweifel an der Legitimität der Daten geäußert, da jedes Mal, wenn eine neue Reihe von Abstimmungsergebnissen veröffentlicht wurde (ähnlich wie in den USA im Iran), der Prozentsatz der Stimmen an Präsident Mahmoud Ahmadinejad ging war das gleiche: 67 Prozent. Die Daten sind normalerweise nicht sauber, und einige fragten sich, ob die Ergebnisse hergestellt worden waren.

Eine Analyse des Mathematikprofessors der Universität Wisconsin, Jordan Ellenberg in Slate, untersucht die Daten jedoch eingehender, um zu zeigen, dass sie tatsächlich unordentlicher waren als erwartet. Die Ergebnisse wurden nicht Stadt für Stadt veröffentlicht, sondern in großen Mengen, bei denen Daten aus verschiedenen Bereichen kombiniert wurden, was bedeutete, dass Ahmadinejads Stimmenzahlen wirklich Durchschnittswerte waren. Und das Gesetz der großen Zahlen schreibt vor, wie Ellenberg schrieb:

Mittelwerte in sehr unterschiedlichen Mengen können und können in der Regel zu Ergebnissen führen, die nahezu einheitlich aussehen. Bei genügend Daten neigen die Ausreißer dazu, sich gegenseitig zu stornieren.

Ellenberg kommt zu dem Schluss, dass die Daten "definitiv chaotisch genug sind, um wahr zu sein".

Benfords Gesetz

Mehrere Analysen haben die ersten Ziffern der iranischen Wahlergebnisse untersucht, um festzustellen, ob sie dem Benfordschen Gesetz entsprechen.

In Zahlenlisten aus vielen (aber nicht allen) realen Datenquellen wird die führende Ziffer auf eine bestimmte, nicht einheitliche Weise verteilt. Nach diesem Gesetz ist die erste Ziffer 1 fast ein Drittel der Zeit, und größere Ziffern treten als führende Ziffer mit immer geringerer Häufigkeit auf, bis zu dem Punkt, an dem 9 als erste Ziffer weniger als ein Mal in zwanzig vorkommt. Diese Verteilung der ersten Ziffern erfolgt logisch, wenn ein Satz von Werten logarithmisch verteilt wird.

Eine Analyse mit diesem Ansatz von Boudewijn Roukema von der Nicolaus Copernicus-Universität in Polen ergab, dass es für Mehdi Karroubi fast doppelt so viele Stimmen gab, die mit der Ziffer 7 begannen, wie es nach Benfords Gesetz zu erwarten war. Darüber hinaus vermutete Roukema, dass die Ergebnisse für Ahmadinedschad, bei denen weniger Einsen und mehr Zweisen und Dreien als erwartet vorlagen, wahrscheinlich gewesen wären, wenn jemand die Ergebnisse manipuliert hätte, indem er die Einsen zu Beginn der Abstimmungsergebnisse auf Zweisen und geändert hätte 3s. Es hätte auch zu einer Überschätzung von Ahmadinedschads Gesamtzahlen um mehrere Millionen Stimmen geführt.

Walter Mebane, Politikwissenschaftler und Statistiker an der Universität von Michigan, verwendete in seiner Analyse auch das Benford-Gesetz, bei dem er auch einige Unregelmäßigkeiten bei den iranischen Wahlergebnissen feststellte. Aber selbst er gibt zu, dass seine Ergebnisse zwar "mit weit verbreitetem Betrug vereinbar" sind, aber auch "mit Ahmadinedschad vereinbar sind, der tatsächlich gewonnen hat".

Die letzten beiden Ziffern

Zwei Absolventen der Politikwissenschaft an der Columbia University nahmen noch ein Drittel der Daten auf. In einer Analyse, die sie in einer Stellungnahme der Washington Post zusammengefasst hatten, untersuchten sie die letzten beiden Ziffern der Stimmenzahl aus 29 Provinzen für jeden der vier Kandidaten (z. B. wenn jemand 14.579 Stimmen erhielt, wurden nur die Ziffern 7 und 9 berücksichtigt) Die Analyse).

Die letzten beiden Ziffern in den Wahlergebnissen sind zufälliges Rauschen, und die Verteilung der Ziffern sollte ziemlich gleichmäßig sein. Jede Ziffer sollte in etwa 10 Prozent der Fälle vorkommen. Der Mensch ist jedoch ein schlechter Zufallsgenerator, und wenn wir Zahlen erfinden, neigen wir dazu, einige Zahlen häufiger als andere zu wählen. In den Iran-Ergebnissen enden nur 4 Prozent der Zahlen mit der Ziffer 5, während die Ziffer 7 in 17 Prozent der Fälle erscheint. Ergebnisse, die so stark abweichen, sind bei etwa vier von 100 Wahlen zu erwarten.

Menschen haben auch Probleme bei der Erstellung von Zahlen mit nicht benachbarten Ziffern (dh, Sie haben mit geringerer Wahrscheinlichkeit 72 als 23), aber diese Zahlen sollten auch zufälligen Mustern folgen und etwa 70 Prozent der Paare sollten aus nicht benachbarten Ziffern bestehen Ziffern. In den Iran-Ergebnissen tun dies jedoch nur 62 Prozent. Wiederum würden diese Ergebnisse in etwa 4 von 100 Wahlen erwartet. Die Kombination der beiden Ergebnisse wäre jedoch nur bei einer von 200 Wahlen zu erwarten. Vielleicht unwahrscheinlich, aber nicht unmöglich.

Wo bleibt uns das? Wir werden möglicherweise nie erfahren, ob die gemeldeten Ergebnisse echt sind oder nicht. Meine persönlichen Lieblingsdaten von all dem erfordern jedoch keine Berechnungen, um zu Fragen der Legitimität der Wahlen zu führen. Dieses Zitat von Abbas-Ali Kadkhodaei, einem Sprecher des iranischen Wächterrates, lässt fast jeden zweimal überlegen:

Von Mohsen Resaei vorgelegte Statistiken, in denen er behauptet, mehr als 100% der Wahlberechtigten hätten ihre Stimme in 170 Städten abgegeben, sind nicht korrekt - der Vorfall ereignete sich nur in 50 Städten.

(Weitere Informationen zu den Wahlergebnissen des Iran finden Sie unter Nate Silver auf fivethirtyeight.com.)