Woran erkennt man eine richtig schlechte Statistik?

Am heutigen Welttag der Statistik ist es an der Zeit, sich der wirklich schlechten Statistik zuzuwenden. Dazu soll noch einmal das »Stadtradeln« herangezogen werden. Heute soll es nicht um den Sinn oder Unsinn der Aktion, sondern nur um die Erhebung und Auswertung der Zahlen gehen. Denn dort findet man alle Merkmale der schlechten Statistik auf engem Raum.


1. Die zweifelhafte Datenbasis

Jeder Bürger kann sich beim »Stadtradeln« anmelden, auch wenn er gar kein Fahrrad hat. Niemand überprüft die Angaben der beteiligten Radfahrer. Schon an dieser Stelle müsste man die Zahlen eigentlich mit Schwung in den Papierkorb werfen. Aber nehmen wir für einen Augenblick an, dass alle Radfahrer ehrlich Buch geführt haben. Die Statistik wird nämlich davon auch nicht besser.


2. Die zweifelhafte magische Zahl

Im Umweltbundesamt wurde irgendwann ermittelt, dass ein durchschnittlicher PKW-Personenkilometer 144 Gramm CO2 verursacht. In einer Publikation aus dem Jahr 2010 heißt es wenig überraschend:

Die verschiedenen Verkehrsträger – Straße, Schiene, Wasser und Luft – weisen streckenbezogen unterschiedliche CO2-Emissionen pro transportierter Person oder Tonne auf. (Quelle (PDF)).

Solche verdichteten Zahlen sind immer dubios, weil dafür viele Annahmen getroffen werden, die der Leser überhaupt nicht nachvollziehen kann. Die angegebenen Zahlen beziehen sich außerdem auf eine Studie aus dem Jahr 2006. Seitdem hat sich die Technik schnell weiterentwickelt. Diese »magische Zahl« muss also aus mindestens zwei Gründen mit äußerster Vorsicht eingesetzt werden.

Das tut die staatlich geförderte Initiative aber gerade nicht: Sie unterstellt, dass jeder gefahrene Fahrrad-Kilometer zu einer Einsparung von 144 Gramm CO2 führt. Offensichtlich geht sie dabei davon aus, dass Fahrräder ohne die Emission von CO2 gebaut, transportiert und bewegt werden können.


3. Die zweifelhafte Präzision

Walter Krämer beginnt seinen Klassiker »So lügt man mit Statistik« mit dem Kapitel »Die Illusion der Präzision«. Darin beschreibt er, dass die meisten Leser einer scheinbar sehr exakten Zahl mehr vertrauen als einer gerundeten Zahl. Darüber hinaus glauben die meisten Menschen besonders stark an große Zahlen.

In den ersten beiden Abschnitten dieses Artikels wurde gezeigt, dass die Datenerfassung zweifelhaft ist und dass die »magische Zahl« zumindest gründlich zu hinterfragen wäre. Schauen wir uns die statistische Auswertung des »Stadtradelns« für Dresden an. Dort werden große Zahlen mit einer scheinbar bestechenden Präzision veröffentlicht:

Die Radler legten bisher insgesamt 452.826 km mit dem Fahrrad zurück und sparten dabei insgesamt 65.206,9 kg CO2 ein (Berechnung basiert auf 144g CO2 / Personen-Kilometer).

Dies entspricht 1.129,95% der Länge des Äquators.

Für alle teilnehmenden Städte und Gemeinden werden seitenlange Tabellen mit noch präziseren Daten veröffentlicht. Dort kann man z.B. nachlesen, wie viele Kilometer die Teilnehmer im »Durchschnitt« zurückgelegt haben. All diese Zahlen werden mit einer oder mehreren Kommastellen veröffentlicht. Aber die Kommastellen sind genauso dubios wie die erfassten Werte. Allenfalls über die Größenordnung kann man diskutieren.

Eine besonders unsinnige Zahl ist der Vergleichswert »1.129,95% der Länge des Äquators«. Wenn man einen Augenblick an die ca. 450.000 gefahrenen Kilometer glauben möchte, könnte man schreiben: »Die beteiligten Dresdner Radfahrer haben eigenen Angaben zufolge mehr als elf Mal den Äquator umrundet.« Alles andere ist höherer Blödsinn.


4. Die zweifelhafte grafische Darstellung

Wo man so viele Statistik-Fehler auf einem Haufen findet, ist die zweifelhafte grafische Darstellung meist nicht weit. Ein Screenshot zeigt die offizielle Grafik der Initiative Stadtradeln für Dresden:

Man kann die Grafik zur Zeit auch mit diesem Link erzeugen. Sie ist schön bunt und ihre Aussagekraft geht gegen Null.


Das Fazit: Eine schlechte Statistik erkennt man an der Unzuverlässigkeit der Erhebung, am Einsatz scheinbar magischer Zahlen, an der zweifelhaften Präzision und meist auch noch an einer manipulativen Darstellung.

Es darf vermutet werden, dass staatliche Förderung ein besonderer Anreiz für schlechte Statistiken ist. Die Stadt Dresden schmückt sich mit den Zahlen der Auswertung, die sie offenbar als wahrhaftig annimmt. Und der Fördermittelgeber tut das natürlich auch. Das wäre früher nie denkbar gewesen: Wenn eine Verwaltung Zahlen veröffentlicht hat, konnte man sich im Normalfall darauf verlassen, dass sie vorher sachlich geprüft wurden.

Je aufgeblasener die Zahlen daherkommen, desto höher ist die Wahrscheinlichkeit, dass man wieder staatliches Fördergeld bekommt. Wenn das Staatsgeld dann doch einmal ausbleibt, dann drohen soziale Proteste gegen »unsoziale Kürzungen«, wobei die Proteste natürlich wiederum durch schlechte Statistiken »gestützt« werden …


Wie das »Stadtradeln« funktioniert, habe ich damals in einem Gastbeitrag für »Zettels Raum« beschrieben. Die Unsinnigkeit der Auswertung habe ich in diesem Artikel aufs Korn genommen.

About these ads

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ photo

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

Follow

Erhalte jeden neuen Beitrag in deinen Posteingang.

Schließe dich 51 Followern an

%d Bloggern gefällt das: