APUZ Dossier Bild

15.7.2002 | Von:
Olaf Köller
Jürgen Baumert

Das Abitur - immer noch eingültiger Indikator für die Studierfähigkeit?

II. Wie wird Studierfähigkeit erfasst?

Die Expertenkommission zur Weiterentwicklung der gymnasialen Oberstufe der Kultusministerkonferenz hat versucht, das latente Programm der gymnasialen Oberstufe mit der Trias von vertiefter Allgemeinbildung, Wissenschaftspropädeutik und Selbstregulation des Lernens als Studierfähigkeit im engeren Sinne zu beschreiben. Dementsprechend gilt nach wie vor die Abiturnote als zentraler Indikator einer allgemeinen Studierfähigkeit. International haben sich allerdings standardisierte Tests, Essays und Interviews als ergänzende Instrumente durchgesetzt. Auch in der Bundesrepublik schien sich, nach seiner Erprobung in den siebziger Jahren, ab 1986 der Test für medizinische Studiengänge (TMS) als ein standardisiertes Verfahren zur Feststellung der Studierfähigkeit in den Bereichen Medizin, Zahnmedizin und Tiermedizin zu etablieren. Der Einsatz des TMS wurde allerdings auf Beschluss der KMK Ende der neunziger Jahre, bemerkenswerterweise unter Hinweis auf die prognostische Validität der Durchschnittsnote im Abitur, eingestellt.

Im Folgenden sollen die verschiedenen Verfahren zur Feststellung der Studierfähigkeit beschrieben und hinsichtlich ihrer Tauglichkeit zur Diagnose der Studieneignung diskutiert werden.

1. Abschlussnoten als Indikatoren der Studierfähigkeit



Schulnoten gelten als Indikatoren des erreichten Leistungsstandes im jeweiligen Fach, indirekt aber auch als Maße einer globalen intellektuellen Leistungsfähigkeit und eines lernfördernden Verhaltens im Unterricht. Insbesondere die Arbeiten von Karlheinz Ingenkamp in den siebziger Jahren [14] haben deutlich gemacht, dass Noten neben ihrer diagnostischen eine sehr starke pädagogische Funktion haben (Belohnung unterrichtsstützenden Verhaltens), oftmals aber auch eine geringe Objektivität, unzureichende Beurteilungsübereinstimmungen und niedrige Wiederholungszuverlässigkeiten aufweisen und daher als brauchbare Indikatoren für die Leistungsfähigkeit von Schülerinnen und Schülern fragwürdig sind. Darüber hinaus wurde häufig ins Feld geführt, dass Noten auf einem klassen- oder schulinternen Referenzrahmen der Lehrkräfte beruhten und Lehrer in ihren Klassen die gesamte Notenskala ausnutzten. Weitgehend unabhängig vom Leistungsniveau einer Klasse insgesamt erhalten die Besten die Note "sehr gut", die Schwächsten dagegen die Note "mangelhaft". Dies führt dann in der Tat dazu, dass dieselbe Note für ganz unterschiedliche Leistungen stehen kann. [15] Umso verblüffender ist der vielfach replizierte Befund, dass die durchschnittliche Abiturnote eines der besten Einzelmaße zur Prognose des Studienerfolgs ist: Je besser die mittlere Abiturnote, desto höher die Leistungen in Universitätsprüfungen. Dies gilt im Übrigen auch für andere Länder wie die USA, wo sich wiederholt gezeigt hat, dass die mittlere Abschlussnote (Grade Point Average) die Studienleistungen noch genauer vorhersagt als die Gesamtnote im Abitur in Deutschland. [16] Für die Bundesrepublik Deutschland wurde über verschiedene Fächer hinweg eine mittlere Korrelation von r = 0,35 zwischen der Abiturnote und Prüfungsleistungen an der Universität festgestellt, in den USA liegt dieser Wert zwischen r = 0,41 und r = 0,53. [17] Höhere Werte können kaum erreicht werden, da der Erfolg an der Hochschule außer von den individuellen Eingangsvoraussetzungen auch von vielen anderen Faktoren abhängt, die erst im Laufe des Studiums wirksam werden.

In Deutschland wie in den USA wurde verschiedentlich versucht, die Vorhersagekraft schulischer Beurteilungen durch eine gewichtete Kombination von Einzelnoten zu verbessern. Diese Versuche waren ebenso wenig erfolgreich wie die Berücksichtigung der Passung zwischen Fachnoten und Studienfächern. Die einzelnen Fachnoten unterscheiden sich zwar erheblich hinsichtlich ihrer Prognosekraft für die Studienleistung, aber selbst die höchste Korrelation zwischen einer einzelnen Note und den Prüfungsleistungen im entsprechenden Fach liegt deutlich unter den berichteten Korrelationen für die Durchschnittsnote. So korrelieren zum Beispiel Studienleistungen in Anglistik mit der Gesamtnote im Abitur höher als mit der Abschlussnote im Schulfach Englisch. [18] Insgesamt belegen diese Befunde, dass sich erfolgreiche Schulkarrieren, die in guten Abschlussnoten zum Ausdruck kommen, an der Universität fortsetzen.

Diese Forschungsergebnisse sind für viele Kritiker der Zensurengebung in der Schule überraschend und widersprechen jenen Behauptungen, nach denen die studienvorbereitende Funktion des Gymnasiums generell verloren gegangen sei. Auf der anderen Seite wird aber auch argumentiert, dass diese Befundlage durchaus plausibel sei. Heinz Schuler beispielsweise führt 2001 ins Feld, dass sich Schul- und Studienleistungen doch in einer ganzen Reihe von Anforderungsaspekten überschnitten. [19] Diese Annahme lässt sich durch empirische Befunde stützen, nach denen die Zusammenhänge zwischen Schulabschlussnoten und Studienleistungen umso enger werden, je verschulter das Studium ist.

2. Kenntnistests



Kenntnistests (Achievement Tests) werden in vielen Ländern (z. B. Belgien, China, Griechenland, Israel, Japan, USA) als Feststellungsverfahren der Studierfähigkeit verwendet. Mit diesen Tests soll der Wissensstand eines Studienbewerbers in Bereichen, die studienrelevant sind, überprüft werden.

Schulfachbezogene Kenntnistests prüfen schulisches Wissen in verschiedenen Bereichen (Muttersprache, Mathematik, Naturwissenschaften, Sozialwissenschaften und Fremdsprachen). Ihnen liegt die Annahme zugrunde, dass die erfolgreich erworbenen schulischen Kenntnisse maßgeblich für den Studienerfolg sind.

Studienfachspezifische Kenntnistests bestehen aus Aufgaben, die sich nicht an den Stoffgebieten der schulischen Fächer im engeren Sinne orientieren, sondern an Voraussetzungen, die für die Aufnahme eines spezifischen Studienganges relevant sind. In den USA zählt der Medical College Admission Test zu diesem Test-Typus.

Validierungsstudien zu schulfach- und studienfachspezifischen Kenntnistests haben gezeigt, dass diese generell zur Feststellung der Studierfähigkeit geeignet sind, in ihrer Prognosekraft aber hinter den gemittelten Abschlussnoten (z. B. Gesamtnote im Abitur) zurückbleiben. [20]

3. Studierfähigkeitstests



Bei diesen Verfahren (im Englischen: Aptitude Tests) werden die geistigen Fähigkeiten und Fertigkeiten erfasst, die für die Bewältigung eines Studiums von Bedeutung sind. Im Gegensatz zu Kenntnistests zielen diese Verfahren nicht auf die Erfassung vorhandener Wissensbestände, sondern testen bestimmte allgemeine Fähigkeiten (Skills), die für das Bestehen im relativ offenen Lernmilieu der Universität notwendig sind.

Allgemeine Studierfähigkeitstests bestehen häufig aus einem sprachlichen und einem mathematischen Teil und erheben den Anspruch, zentrale Voraussetzungen für beinahe alle universitären Fächer zu erfassen. Diesem Test-Typus entspricht der Scholastic Aptitude Test (SAT), ein reiner Multiple-choice-Test, der in den USA als wichtigstes Feststellungsverfahren der Studierfähigkeit gilt. Die Teilnahme am SAT und hohe Punktzahlen sind in den USA notwendig, um an prestigereichen Universitäten studieren zu können.

Studienfachspezifische Fähigkeitstests sind hinsichtlich ihrer Aufgaben auf einzelne Fächer zugeschnitten. Das sicherlich prominenteste Verfahren dieses Typus ist der Test für die medizinischen Studiengänge (TMS), der in den achtziger und neunziger Jahren zur Diagnose der Studierfähigkeit in den Studiengängen Medizin, Tiermedizin und Zahnmedizin eingesetzt wurde. Das Verfahren enthält neun Untertests (Muster zuordnen, Medizinisch-naturwissenschaftliches Grundverständnis, Schlauchfiguren, Quantitative und formale Probleme, Konzentriertes und sorgfältiges Arbeiten, Figuren lernen, Fakten lernen, Textverständnis und Diagramme und Tabellen). Der TMS wurde bewusst so konstruiert, dass er möglichst niedrig mit der Abiturnote korrelieren sollte. Dennoch ergaben sich in Validierungsstudien Zusammenhänge zwischen beiden Maßen in der Größenordnung von r = 0,40. Im Studiengang Medizin ergab sich eine Korrelation von r = 0,44 zwischen TMS-Ergebnis und Leistungen in der Ärztlichen Vorprüfung, die etwas höher lag als der Zusammenhang zwischen Abiturnote und Vorprüfungsleistungen (r = 0,38). Bei Kombination von Abiturnote und TMS-Wert ergab sich ein Zusammenhang von r = 0,51. Dieser Anstieg in der Vorhersagekraft über die Einzelkorrelationen hinaus weist darauf hin, dass TMS und Abiturnote unterschiedliche Facetten der Studierfähigkeit abbildeten.

Weniger befriedigend waren die Befunde zur Vorhersage der Prüfungsleistungen in der Tier- und Zahnmedizin. Hier lagen die Korrelationen des TMS unter denen der Abiturnote. Insgesamt konnte aber gezeigt werden, dass der TMS für den Studienerfolg in den ausgewählten Fächern prädiktiv ist.

4. Fremdsprachentests



In einigen Ländern (z. B. Japan) werden Fremdsprachentests verwendet, die üblicherweise Aufgaben zum Wortschatz, zur Grammatik, zum Hör- und zum Leseverständnis enthalten, selten aber Aufgaben zur Sprachproduktion. Amerikanische Universitäten verlangen von nichtamerikanischen Studenten das erfolgreiche Abschneiden im so genannten Test of English as a Foreign Language (TOEFL). Um an einer amerikanischen Universität zum Studium zugelassen zu werden, muss man in diesem Test bestimmte Schwellenwerte erreichen. Das Erreichen von Cut-off-Werten in diesem Test ist ein notwendiges, aber nicht hinreichendes Kriterium für die Aufnahme an einer Universität, wobei dieser Cut-off-Wert an prestigereichen Universitäten (z. B. Yale) deutlich höher (zwischen 550 und 600) liegt als an prestigearmen (um 500). Der TOEFL besteht aus drei Untertests (Hörverständnis, Wortschatz und Leseverständnis, Rechtschreibung und Grammatik). Validierungsstudien des Educational Testing Service in Princeton, New Jersey, wo der TOEFL entwickelt wurde und ständig modifiziert wird, haben moderate Zusammenhänge (um r = 0,30) mit Studienleistungsindikatoren ergeben. [21]

5. Essays und Interviews



Sofern die Feststellung der Studierfähigkeit und die Auswahl von Studenten bei den Universitäten selbst liegt, wie dies in vielen Ländern der Fall ist, werden auch Einzelinterviews mit Bewerbern geführt oder diese werden aufgefordert, zu vorgegebenen Themen Essays zu schreiben. Beide Verfahren geben den Vertretern der Universitäten einen persönlicheren Eindruck von den Bewerbern. Für beide Verfahren gilt aber, dass ihre Validität als Indikator der Studierfähigkeit hinter den Abschlussnoten und standardisierten Studierfähigkeitstests zurückbleibt.

Fußnoten

14.
Vgl. Karlheinz Ingenkamp, Die Fragwürdigkeit der Zensurengebung, Weinheim 1971.
15.
Vgl. hierzu Olaf Köller/Jürgen Baumert/Kai U. Schnabel, Wege zur Hochschulreife. Offenheit des Systems und Sicherung vergleichbarer Standards, in: Zeitschrift für Erziehungswissenschaft, 2 (1999) 3, S. 385-422.
16.
Dies hängt vermutlich mit der stärkeren Verschulung der Studiengänge in den USA zusammen (vgl. Günther Trost, Vorhersage des Studienerfolgs, Braunschweig 1975).
17.
Der Korrelationskoeffizient r drückt die Stärke des linearen Zusammenhangs zwischen zwei Maßen aus. Er kann theoretisch zwischen -1 und +1 schwanken. Bei einem Zusammenhang von r = +1 lässt sich das eine Maß exakt durch das andere vorhersagen, und zwar in dem Sinne, je höher die Werte in Maß A, desto höher auch die Werte in Maß B. Ein Koeffizient von r = -1 beschreibt ebenfalls einen perfekten linearen Zusammenhang, allerdings gehen jetzt mit kleineren Werten auf A größere auf B einher. Bei einem Zusammenhang von r = 0 sind beide Maße voneinander unabhängig. In der internationalen Literatur zu Zusammenhängen zwischen Indikatoren der Studieneignung und universitären Prüfungsleistungen gelten Korrelationskoeffizienten zwischen 0,30 und 0,40 als sehr zufriedenstellend, Werte über 0,50 sind sehr selten.
18.
Vgl. Jutta Baron-Boldt, Die Validität von Schulabschlussnoten für die Prognose von Ausbildungs- und Studienerfolg, Frankfurt/M. 1989.
19.
Vgl. Heinz Schuler, Noten und Studien- und Berufserfolg, in: Detlef H. Rost (Hrsg.), Handwörterbuch Päda"gogische Psychologie, Weinheim 2001.
20.
Vgl. Deidesheimer Kreis, Feststellung der Studieneignung im Rahmen der Hochschulzulassung, Bonn 1993.
21.
Bei der Beurteilung dieser nicht allzu hohen Koeffizienten muss allerdings bedacht werden, dass die Universitäten ja nur die Studentinnen und Studenten aufnehmen, die bereits relativ hohe Werte haben. Dies führt auf Seiten des TOEFL zu einer Varianzreduktion und senkt die Korrelation mit anderen Maßen.