30 Jahre Mauerfall Mehr erfahren
Zukunft Bildung

1.4.2016 | Von:
Barbara Kerbel

Das Dilemma mit den Schulnoten

Ziffernnoten von 1 bis 6 gehören zur Schule wie Unterricht, Klassenfahrt und Pausenbrot. Aber seit Jahrzehnten stehen Noten in der Kritik. Sie gelten als ungerecht, beliebig, nicht vergleichbar. Warum werden sie dann immer noch fast überall vergeben?

Ein Junge hält in einem Klassenzimmer der Mittelschule St. Stephan in Straubing (Niederbayern) sein Zwischenzeugnis in der Hand.Ein Junge hält in einem Klassenzimmer der Mittelschule St. Stephan in Straubing (Niederbayern) sein Zwischenzeugnis in der Hand. (© picture-alliance/dpa)

Wer im Zeugnis in Mathe eine 1 hat, kann sich über die eigene Spitzenleistung freuen; wer eine 3 bekommt, weiß sich im Mittelmaß; und wer eine 6 im Zeugnis stehen hat, weiß, dass die Matheleistung in diesem Schuljahr "ungenügend" war. Noten fassen Informationen in Zahlen zusammen, die auf einen Blick verständlich sind.

Doch an dieser Reduktion auf Zahlen gibt es seit vielen Jahren Kritik. Noten gelten als ungerecht, anfällig für Verzerrungen und schlecht vergleichbar. Vor allem Grundschullehrkräfte setzen sich dafür ein, Ziffernnoten durch andere Bewertungsformen zu ersetzen. Walddorfschulen und reformpädagogische Modellschulen verzichten bis zur Oberstufe auf Noten. Mehrere Bundesländer probieren Alternativen zu den traditionellen Zensuren aus. Sind Noten so schlecht, wie ihre Kritiker behaupten? Und wenn ja: Warum werden sie trotzdem noch überall vergeben? Wer braucht Noten? Ein Überblick über die wichtigsten Fragen in der Debatte um Ziffernnoten.

i

Wie lassen sich Messverfahren beurteilten – und was heißt das für Schulnoten?

Viele Fragen, für die sich Forscherinnen und Forscher interessieren, können nur durch das Zählen und Messen von Phänomenen beantwortet werden. Weil das Messen in der Wissenschaft eine so zentrale Rolle spielt, hat man sich auf eine Reihe von Gütekriterien geeinigt, mit deren Hilfe sich feststellen lässt, wie gut ein Messverfahren tatsächlich ist. Auch bei Schulnoten handelt es sich um Messungen: Denn sie haben den Anspruch die Leistung von Schülerinnen und Schülern zu messen, ob in einem Fach, einer Klassenarbeit oder einer mündlichen Prüfung. Daher lassen sich die in der Wissenschaft etablierten Gütekriterien für das Messen auch auf Schulnoten beziehen. Welche Bedingungen müssten Noten demnach erfüllen, um als gutes Messverfahren gelten zu können?

  • Objektivität: Ist ein Messverfahren unabhängig von der Person, die es anwendet? Das misst die Objektivität. Eine Messung ist dann objektiv, wenn verschiedene Beobachter zu gleichen Ergebnissen kommen. Schulnoten wären demnach dann objektiv, wenn verschiedene Lehrkräfte die Leistung einer Schülerin oder eines Schülers mit derselben Note bewerten.

  • Reliabilität: Misst ein Messverfahren zuverlässig? Das erfasst die Reliabilität. Eine Messung ist unter anderem dann zuverlässig, wenn eine Person bei wiederholter Messung das gleiche Ergebnis bekommt. Für Schulnoten bedeutet das: Sie wären dann zuverlässig, wenn eine Schülerin oder ein Schüler dieselbe Note bekäme, wenn sie oder er hintereinander zwei Arbeiten mit vergleichbaren Aufgaben schreiben würde.

  • Validität: Wie gut misst ein Messverfahren wirklich das, was es messen soll? Auf diese Frage zielt die Validität (Gültigkeit) ab. Dazu werden zum Beispiel Beobachtungen und Messergebnisse aus verschiedenen Quellen miteinander verglichen. Schulnoten gälten folglich dann als valide, wenn Schülerinnen und Schüler, die in einer Arbeit eine gute Note erreicht haben, in anderen Prüfungen, die sich auf denselben Wissensbereich beziehen, ebenfalls gut abschneiden.


Frage 1: Was messen Noten?

Was genau bedeutet eine 2 in Deutsch? Hinter der Zahl steht eine Fülle von Einzelleistungen. Kritikerinnen und Kritiker der Ziffernnoten sagen: Man erfährt durch eine Note nicht, was ein Kind wirklich kann. In die Deutschnote gehen unter anderem Leseverständnis, schriftliches Formulieren, Rechtschreibung und mündlicher Ausdruck ein. Vielleicht kann die Schülerin oder der Schüler hervorragend formulieren, hat aber Schwächen in der Rechtschreibung? Die Gesamtnote, für welche der Durchschnitt aus mehreren Teilleistungen gebildet wird, gleicht solche Unterschiede aus – und macht sie dadurch unsichtbar. Dazu kommt die grundsätzliche Frage, ob Noten den tatsächlichen Wissensstand in einem Fach erfassen können. Um das zu beantworten, vergleichen Bildungsforscherinnen und Bildungsforscher Schulnoten mit Bewertungen aus anderen Quellen, zum Beispiel mit den Leistungen der Kinder in standardisierten Tests. Das wurde auch in der Pisa-Studie 2006 gemacht, in der die naturwissenschaftliche Kompetenz von 15-jährigen Schülerinnen und Schülern untersucht wurde.

Dabei fand sich ein Zusammenhang zwischen Schulnoten und naturwissenschaftlicher Kompetenz: Wer in Biologie, Physik und Chemie gute Noten hatte, erreichte auch im Pisa-Test tendenziell eine höhere Punktzahl. Allerdings war dieser Zusammenhang relativ schwach. Die Autoren der deutschen Pisa-Studie 2006 erklären dies damit, dass Pisa-Test und Schulnoten unterschiedliche Facetten der Leistung erfassen. Zeugnisnoten, die sich aus Klassenarbeiten, Tests und mündlichen Abfragen während des Schuljahres zusammensetzen, spiegeln demnach eher kurzfristige Lerneffekte wieder, oft bezogen auf konkrete Prüfungen. Der Pisa-Test dagegen prüfe vor allem die Nachhaltigkeit und flexible Anwendung des Gelernten.

Vorsicht bei Vergleichen

Noten ermöglichen es, sich ohne großen Aufwand ein Bild von der Leistung einer Person zu machen und Personen miteinander zu vergleichen. Tatsächlich sind solche Vergleiche aber problematisch. Denn für die Notengebung ist die jeweilige Lerngruppe die Bezugsgröße. Noten bilden somit nicht den objektiven Leistungsstand ab, sondern die Rangfolge innerhalb einer Klasse. Daran ändert auch die Tatsache nichts, dass es einen gewissen Zusammenhang zwischen Noten und den in standardisierten Tests wie PISA gemessenen Leistungen gibt.

Bezugsgröße ist die Klasse

Die klassische sechsstufige Notenskala beruht auf der Annahme, dass Begabung und Leistung einer Normalverteilung folgen: Der größte Teil der Klasse liegt im Durchschnittsbereich, dazu kommen einige sehr gute und einige besonders schlechte Schülerinnen und Schüler. Dieses Muster soll sich in der Verteilung der Zensuren abbilden. Das bedeutet, dass Lehrkräfte in Tests einige besonders schwere Aufgaben einbauen müssen, die nur die besten Schülerinnen und Schüler lösen können. Schulleitungen und Schulbehörden drängen Lehrkräfte unterschiedlich stark dazu, dieses Schema bei der Bewertung zu berücksichtigen.

Hier eine 2, dort eine 4

Aus der Orientierung an der Normalverteilung folgt, dass eine mittelmäßige Leistung in verschiedenen Klassen zu unterschiedlichen Noten führen kann: In einer schlechten Klasse gibt es dafür vielleicht schon eine 2, in einer guten Klasse nur eine 4. Ein Vergleich von Zensuren ist damit nur sehr eingeschränkt möglich. Das gilt für verschiedene Klassen im selben Jahrgang einer Schule, ebenso für Vergleiche zwischen Schulen – und erst recht für den Vergleich von Noten aus verschiedenen Bundesländern, in denen darüber hinaus nach unterschiedlichen Lehrplänen unterrichtet wird.

Frage 2: Sind Noten objektiv?

Mehrere Lehrkräfte beurteilen dieselbe Arbeit zum Teil deutlich anders. Das haben Studien wiederholt gezeigt. Im Fall von Deutschaufsätzen ist das vielleicht wenig überraschend und in der Tat wird deren Bewertung auch von vielen Wissenschaftlern als sehr subjektiv und schwierig eingeschätzt. Tatsächlich haben Studien aber auch für vermeintlich objektive Kriterien wie Mathematikaufgaben und Rechtschreibung teilweise große Unterschiede in der Bewertung festgestellt (Beispiel finden sich bei Brügelmann und Backhaus, 2006). Eine Erklärung dafür ist die Tatsache, dass Pädagoginnen und Pädagogen bei der Benotung grundsätzlich sehr viel Spielraum haben. So ist es etwa an den meisten Schulen den einzelnen Lehrkräften überlassen, wie viele Punkte sie in einer Klausur für eine richtige Antwort vergeben und wie viel sie pro falscher Antwort von der Gesamtpunktzahl abziehen. Zwar erkennen immer mehr Schulen das Problem und legen einheitliche Bewertungsstandards fest; allerdings gelten diese nur für schriftliche Arbeiten. Dasselbe Problem stellt sich aber natürlich auch bei der Bewertung von mündlichen Leistungen, wo die Lehrkräfte in der Regel noch größeren Spielraum haben. Sie können nämlich nicht nur entscheiden, wie sie im konkreten Fall bewerten, sondern auch, wie viele mündliche Noten sie sammeln. So wird eine Schülerin, die nach einer missglückten Klausur noch mehrere Chancen bekommt, sich mündlich zu verbessern, am Ende wahrscheinlich eine bessere Zeugnisnote bekommen als eine Schülerin, die diese Möglichkeit nicht bekommen hat.

Was Urteile verzerrt

Hinzu kommt der Fakt, dass menschliche Urteile oft von unbewussten psychologischen Prozessen beeinflusst sind. So wird eine Lehrkraft eine durchschnittliche Arbeit sehr wahrscheinlich dann besser bewerten, wenn sie zuvor mehrere schlechte Arbeiten korrigiert hat. Auch der bisherige Eindruck von einer Schülerin oder einem Schüler kann die Bewertung beeinflussen: Hat ein Kind bisher nur tolle Aufsätze geschrieben, liest die Lehrerin oder der Lehrer eine Deutschklausur womöglich mit einem gedanklichen Bonus im Hinterkopf, der schließlich zu einer besseren Note führen kann. Solche Verzerrungsmechanismen sind in psychologischen Studien gut belegt worden – und gelten nicht nur für Lehrkräfte, die eine Arbeit korrigieren (einen Überblick geben zum Beispiel Brügelmann & Backhaus, 2006 und Oelkers, 2001).

Creative Commons License

Dieser Text ist unter der Creative Commons Lizenz "CC BY-NC-ND 3.0 DE - Namensnennung - Nicht-kommerziell - Keine Bearbeitung 3.0 Deutschland" veröffentlicht. Autor/-in: Barbara Kerbel für bpb.de

Sie dürfen den Text unter Nennung der Lizenz CC BY-NC-ND 3.0 DE und des/der Autors/-in teilen.
Urheberrechtliche Angaben zu Bildern / Grafiken / Videos finden sich direkt bei den Abbildungen.