M 01.06 Von den Tücken und Gefahren, die in Statistiken lauern
Statistiken erscheinen uns oft als objektiv, wahr oder richtig, dabei können sie durch eine falsche bzw. verzerrende Darstellungsweise der Daten oder durch fehlende Informationen den Betrachter in seiner Wahrnehmung manipulieren und einen falschen Eindruck erwecken.Zitate zum "Lügen mit Statistik":
- „Vertraue keiner Statistik, die du nicht selbst gefälscht hast!“ (Laut Wikipedia von der deutschen Propaganda während des Zweiten Weltkriegs erfunden und von dieser Winston Churchill zugeschrieben)
- „Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz "Mit Statistik kann man alles beweisen" gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen.“ (Elisabeth Noelle-Neumann)
Sammlungen von unsinnigen oder falschen Statistikdarstellungen und -interpretationen können helfen, einen Blick dafür zu entwickeln, worauf man beim Lesen von Artikeln mit Statistiken achten sollte, z.B. diese:
- Auf den Seiten des Instituts für Angewandte Statistik der Universität Linz, präsentiert Andreas Quatember unter dem Stichwort "Unsinn in den Medien - vom sorglosen Umgang mit Daten" aktuelle Beispiele aus den Medien und erläutert den Unsinn in den besagten Grafiken und Interpretationen
- Unter dem Stichwort " Unstatistik des Monats" veröffentlichen der Berliner Psychologe Gerd Gigerenzer, der Bochumer Ökonom Thomas Bauer und der Dortmunder Statistiker Walter Krämer jeden Monat aktuell publizierte Zahlen und deren Interpretationen, um diese kritisch zu hinterfragen.
Eine moderne statistische Fälschung liegt weniger in der Veränderung der Zahlen selbst, sondern beispielsweise in der Kombination von ermittelten Zahlen oder einer fehlerhaften Darstellung. Das Lügen mit Hilfe der Statistik ist heutzutage kinderleicht, weil dem Zauber der Zahlen gerne ungeprüft Glauben geschenkt wird.
„Lügen“ mit Statistik kann aber auch unfreiwillig geschehen.
Mögliche Fehlerquellen beim Erstellen und Lesen von Statistiken sind zum Beispiel:
- Fehler beim Sammeln der Daten: z.B. eine falsche/ungeeignete Stichprobe. Wenn man beispielsweise eine Aussage über das Klima in der eigenen Klasse machen möchte, reicht es nicht aus, nur die besten 10 Schülerinnen und Schüler in der Klasse zu fragen; man müsste die komplette Klasse befragen.
- Fehler beim Behandeln der Daten: z.B. Verzerrungen durch Gruppen-/Klassenbildung. Wenn man beispielsweise bei einer 5er-Skala zwei neue Antwortgruppen bildet und dabei in der einen Gruppe drei Antwortmöglichkeiten und bei der zweiten nur zwei zusammenfasst, entsteht der Eindruck, es handle sich um zwei gleiche Gruppen, obwohl die Aufteilung der eigentlichen Antwortmöglichkeiten der Skala nicht gleichmäßig erfolgt ist.
- Fehlerhafter Sprachgebrauch bei der Beschreibung der Zahlen im begleitenden Text: Wenn im Text beispielsweise „41% aller Befragten" steht, sich die Prozentzahlen aber nur auf die Gruppe der weiblichen Befragten bezieht, so ist die Formulierung im Text falsch und führt zu Missverständnissen (Insbesondere bei der Beschreibung der Zahlen in Kreuztabellen sollte man beachten, auf welche Grundgröße sich die Prozentwerte beziehen!).
- Fehlerhafter Sprachgebrauch kann aus Unklarheit der statistischen Begriffe resultieren: Wofür stehen sie? Was sagen sie aus?
- z. B. Prozente:
- können Informationen/Aussagen über ein Verhältnis des Einzelnen zum Ganzen geben,
- können Informationen schlucken,
- sehen oft – vor allem bei kleinen Zahlen – besser aus.
- Mittelwerte: Median <-> arithmetisches Mittel
- z. B. Prozente:
- Fehler bei der Interpretation der Daten: Ein Fehler bei der Interpretation der Daten kann z.B. die fehlende Unterscheidung von Kausalität <-> Korrelation sein. Eine Korrelation stellt nicht unbedingt einen Kausalzusammenhang her. "Bierverbrauch pro Kopf in Deutschland ist signifikant höher als in Finnland" und "Die Pisa Ergebnisse in Finnland liegen deutlich höher als in Deutschland". Daraus folgt natürlich nicht, dass der Bierverbrauch Schuld am schlechten Abschneiden Deutschlands an der Pisa Studie ist.
- Unzulässige Verallgemeinerung oder Herausstellungen von Ergebnissen: Ergebnisse der Klassenbefragung können z.B. nicht auf die gesamte Schule oder Jahrgangsstufe übertragen werden.
- Fehlerhafte Bilddarstellung: Die Darstellungsform ist eine der häufigsten Fehlerquelle, so findet man recht häufig Darstellungsformen, die eine Tendenz unterstützen (z.B. durch Skalierungen, die nicht bei 0 anfangen -> Zuwächse/Steigerungen sehen viel größer aus, als sie in Wirklichkeit sind.)
- Fehlende wichtige Zusatzinformationen: Durch versehentliche oder aber auch absichtliche Unterschlagung von wichtigen Zusatzinformationen zur Befragtengruppe, dem genauen Wortlaut der Frage(n), Zeitpunkt der Befragung etc. wird die Aussagekraft von Statistiken gemindert, was u.U. zu Fehldeutungen führen kann.
- Erstelle auf Grundlage des Textes eine stichwortartige Anleitung für deine Mitschüler/innen, worauf diese beim kritischen Betrachten einer Statistik achten sollten, um Fehler zu vermeiden und Betrug zu erkennen.
