Reichstag, Sitz des Deutschen Bundestages

2.11.2012

MG 02.14 Hinweise und Anleitung zur Gewichtung

Eine Gewichtung muss immer dann durchgeführt werden, wenn die Verteilung der Datensätze einer Befragung an gewünschte sozialstatistische Merkmale angepasst werden soll. Dies ist beispielsweise bei Wahlprognosen häufig notwendig, bei denen die Befragungsdaten dem demografischen Vergleich nicht entsprechen (z.B. Unterrepräsentanz der "älteren Frauen"). Um das Ausmaß der evtl. erforderlichen Gewichtungen ermessen zu können, muss zunächst anhand der amtlichen Bevölkerungsstatistik (für eine Wahlprognose diejenige der wahlberechtigten Bevölkerung!) geprüft werden, ob die sozio-demografische Zusammensetzung der von den Schülerinnen und Schülern Befragten die örtliche Struktur einigermaßen repräsentativ widerspiegelt.

Gewichten mit GrafStatGewichtungsfunktion in GrafStat
Je nach Erhebungsplan ist die Stichprobe mehr oder weniger zufällig und bildet nur in Ausnahmefällen bestimmte Merkmale der örtlichen Bevölkerungsstruktur genau ab. Für gute Vorhersagen und Analysen ist es daher sehr förderlich, wenn relevante Merkmale der Stichprobe mit den demografischen Merkmalen des Erhebungsgebietes übereinstimmen. In einem gewissen Maße kann durch nachträgliche Gewichtung nach Merkmalen wie Geschlecht, Alter oder Berufsgruppe eine bessere Vorhersagewahrscheinlichkeit erzielt werden.

Stellt man also Disproportionen fest, sollte das Datenmaterial mit GrafStat vor der eigentlichen Analyse der Daten gewichtet werden. Mit Hilfe der Gewichtungsfunktion wird die Stichprobe entsprechend den eingegebenen Vergleichswerten um die Fälle zufällig reduziert, die überrepräsentiert sind.

Die Gewichtung verbessert auf diese Weise die Qualität des Datenmaterials hinsichtlich seiner Repräsentativität und ermöglicht somit bessere Prognosen und Analysen. Durch einen Abgleich der Erhebungsstichprobe mit den regionalen demografischen Daten für die wahlberechtigte Bevölkerung steigt die Prognosesicherheit merklich. GrafStat bietet eine einfach anwendbare Methode der Gewichtung.

Vorbereitungen
Die Gewichtung erfordert einige Vorarbeit und sehr konkrete Planungen bei der Konzeption des Fragebogens. Für die Arbeit mit GrafStat müssen die zwei Merkmale, nach denen gewichtet werden soll - für die Wahlprognose in der Regel Alter und Geschlecht -, auch im Fragebogen erfasst werden. Zudem sollten zu diesen Merkmalen aktuelle statistische Daten der (wahlberechtigten) Bevölkerung vorliegen, etwa aus statistischen Jahrbüchern der Gemeinde oder von der Homepage des statistischen Amts für den Wahlkreis. Schon bei bzw. vor der Zusammenstellung des Fragebogens sollte dieses statistische Material vorliegen, damit die entsprechenden Fragen im Fragebogen im gleichen Format angelegt werden. So ist beispielsweise die Altersklassifizierung in keiner Weise genormt, doch nur wenn dieselbe Klassenbildung im Fragebogen vorliegt (z.B. 18-29; 30-39; 40-49 … oder aber 18-30; 31-40; 41-50 etc.) kann später die Gewichtung überhaupt durchgeführt werden. Außerdem ist zu beachten, dass GrafStat nur nach Einfachwahlfragen oder Skalenfragen gewichten kann, somit wäre eine Maßzahlfrage für die Altersangabe keine brauchbare Alternative, sofern danach gewichtet werden soll.

Gewichtungsprozess mit GrafStat
In eine Gewichtungstabelle werden die statistischen Daten eingegeben, die das Ziel der Gewichtung darstellen. Nach der Gewichtung soll eine Befragungsstichprobe vorliegen, die möglichst nahe an die tatsächliche Verteilung herankommt. Dazu stellt GrafStat einen zufallsweise ausgewählten, angenäherten Datenpool aus der durchgeführten Befragung zusammen, und zwar indem durch Entfernen von Datensätzen aus den überrepräsentierten Gruppen eine Annäherung an die Zielvorgabe erreicht wird.

Zur Information über den aktuellen Gewichtungsfortschritt wird ein Informationsfenster mit Fortschrittsanzeigen eingeblendet. Es kann sogar passieren, dass eine Gewichtung erfolglos abgebrochen wird. Am Ende einer erfolgreichen Gewichtung wird die gewichtete Befragung unter einem neuen Namen abgespeichert.

Hinweise
  • Jeder Gewichtungslauf auf dem Gesamtdatensatz liefert ein anderes Ergebnis!
  • Es kann nur nach zwei Merkmalen gleichzeitig gewichtet werden!
  • Es kann nur nach Einfachwahl- oder Skalenfragen gewichtet werden.
  • Bei der Datengewichtung führt Sie ein Assistent durch die notwendigen Schritte.
Anleitung zur Gewichtung mit GrafStat
Die Gewichtung erfolgt in folgenden Schritten (Kurzanleitung):
  • Starten Sie unter "Verwaltung" den Assistenten für Gewichtungen (Datenbehandlung -> Gewichten).
  • Betätigen Sie die Schaltfläche "weiter".
  • Wählen Sie ein oder zwei Merkmale aus, nach denen Sie gewichten wollen, z. B. "Alter" und "Geschlecht".
  • Betätigen Sie die Schaltfläche "weiter".
  • Tragen Sie die gewünschten Werte in die Tabelle ein.
  • Betätigen Sie die Schaltfläche "weiter".
  • Wenn der Gewichtungslauf erfolgreich war, können Sie die gewichtete Befragung unter einem neuen Namen sichern.
Eingabe der Gewichtungsdaten
Die Gewichtungstabelle ist so aufgebaut, dass sowohl Informationen abgelesen als auch Informationen eingegeben werden können. Dazu sind die Innenzellen der Tabelle als Eingabefelder ausgebildet, während die Randzellen ausschließlich Informationen anzeigen können.
Gewichtungstabelle in GrafStatGewichtungstabelle in GrafStat

Klicken Sie einfach in die zu ändernde Zelle. Tragen Sie nun den gewünschten Wert ein. Drücken Sie abschließend "Enter". Es werden nun neue Randzellenwerte angezeigt. Geben Sie auf die gleiche Weise alle anderen Werte in die entsprechenden Eingabefelder ein.

Sind alle Eingaben erfolgt, muss das Summenfeld einen Wert von annähernd 100% ausweisen (+- 0,5%), anderenfalls kann keine Gewichtung durchgeführt werden.

Nach Betätigen der "Weiter"-Taste zeigt Ihnen ein Fenster den Fortgang des Gewichtungsprozesses an. Die Fortschrittsanzeige "fertig" zeigt den Stand des Gesamtprozesses an. Die Anzeige "Versuche" gibt Aufschluss über den Fortschritt von Teilprozessen. Erreicht diese Anzeige den Endwert, so wird die Gewichtung erfolglos abgebrochen, denn die Zufallswahlen konnten in einer akzeptablen Anzahl von Versuchen den Zielwert nicht erreichen.

Auf der nächsten Seite des Assistenten können Sie schließlich die fertig gewichtete Befragung speichern. Geben Sie einen anderen Namen ein als den ursprünglichen, damit die Ausgangsdaten nicht verloren gehen. Dies empfiehlt sich insbesondere auch für den Fall, dass Sie den Datensatz später evtl. noch einmal nach anderen Angaben oder Merkmalen gewichten wollen.

Eigener Text in Anlehnung an die GrafStat-Hilfe