Fragestellungen der Studie:

  • Welche Wirkungen haben Klassenwiederholungen auf den Kompetenzzuwachs im Fach Mathematik?
  • Welche Konsequenzen haben Klassenwiederholungen für Motivation und Einstellungen in Bezug auf das Fach Mathematik?

Rezension zur Studie

Ehmke, T., Sälzer, C., Pietsch, M., Drechsel, B. & Müller, K. (2017). Kompetenzentwicklung im Schuljahr nach Pisa 2012: Effekte von Klassenwiederholungen. Zeitschrift für Erziehungswissenschaft, Suppl. 2(20), 99–124.FIS Bildung

Die Untersuchung widmet sich der Frage, welche Konsequenzen die Klassenwiederholung für die Entwicklung von Kompetenzen, Motivation und Einstellungen in Bezug auf das Fach Mathematik hat.

Die Autorinnen und Autoren verwenden Daten von PISA 2012 und des IQB-Ländervergleichs 2012 sowie der Wiederholungsuntersuchung im Folgejahr. Um zu einer statistisch abgesicherten Aussage zu kommen, konstruieren sie zu der Gruppe der Wiederholerinnen und Wiederholer mittels Propensity Score Matching eine Vergleichsgruppe von Schülerinnen und Schülern, welche – bei ansonsten ähnlichen soziodemographischen Merkmalen und Leistungsergebnissen – die Versetzung erreicht hat.

Entgegen den Erwartungen zeigt sich, dass eine Wiederholung nicht zu einem überdurchschnittlich starken Zuwachs an mathematischen Kompetenzen im Vergleich zur Versetzung führt. Bei fachspezifischer Motivation und fachspezifischen Einstellungen bestätigt sich die erwartete positivere Entwicklung nur hinsichtlich einer verbesserten Arbeitseinstellung der Wiederholenden.

Vor dem Hintergrund dieser Befunde raten die Autorinnen und Autoren dazu, in Bezug auf die Kompetenz-, Motivations- und Einstellungsentwicklung eher auf individuelle Förderung als auf Klassenwiederholung zu setzen.

Die in hohem Maße relevante Fragestellung und der methodische Ansatz, mittels der Befunde einer konstruierten Vergleichsgruppe zu argumentieren, machen den Wert der Studie aus. Methodische Probleme schränken die Aussagekraft der Ergebnisse jedoch ein. So bleiben hinsichtlich der Konstruktion einer passenden Vergleichsgruppe ebenso Fragen offen wie bezüglich der Rolle von Kompetenzen, die üblicherweise im Rahmen des alltäglichen Unterrichtsgeschehens erfasst werden. Auch ist ungeklärt, inwiefern die Kompetenzen im Fach Mathematik im Einzelfall versetzungsrelevant waren, was jedoch für fachbezogene Motivation und Einstellungen eine Rolle spielen dürfte. Zudem erscheint die Schlussfolgerung zum Verhältnis von Wiederholung und individueller Förderung als nicht ausreichend begründet.

In Staaten mit gegliederten Schulsystemen – etwa Deutschland – erfolgt in der Regel eine Gruppierung der Lernenden aufgrund der Leistung. Schulklassen sind dementsprechend vergleichsweise leistungshomogen. Um trotz der unterschiedlichen Leistungsfortschritte der Lernenden diese Homogenität zu erhalten, müssen Schülerinnen und Schüler eine Klasse wiederholen, wenn sie die grundlegenden Stufenziele nicht erreicht haben und daher ein erfolgreiches Lernen in der nächsten Jahrgangsstufe nicht zu erwarten ist. Im internationalen Vergleich ist die Wiederholungshäufigkeit in Deutschland vergleichsweise hoch (wenngleich von Bundesland zu Bundesland sehr unterschiedliche Regelungen bestehen).

Damit stellt sich für die Autorinnen und Autoren die Frage, welche Wirkungen eine Klassenwiederholung hat. Sie untersuchen neben den Folgen dieser Maßnahme für die Kompetenzentwicklung auch Konsequenzen für Motivation und Einstellungen gegenüber dem Fach. Ausgewertet wurden dazu Daten für das Fach Mathematik, welche im Rahmen der Pisa-Studie 2012 und dem annähernd gleichzeitig durchgeführten IQB-Ländervergleich sowie einer Messwiederholungsstudie im Folgejahr erhoben wurden.

Mit der Frage nach der Wirksamkeit von Klassenwiederholungen stehen die Autorinnen und Autoren in einer umfangreichen Forschungstradition. Auch wenn angesichts der Komplexität des Forschungsgegenstands und unterschiedlicher Stichproben, des Forschungsdesigns und der Vergleichsperspektiven keine vollständige Übereinstimmung besteht, zeigen die Ergebnisse der älteren Forschungen für die einzelnen Schülerinnen und Schüler eher negative als positive Folgen von Klassenwiederholungen.

Als wesentliches Problem des Forschungsdesigns älterer Studien, auf das Lorence (2006) aufmerksam machte, ist vor allem der Bezug auf adäquate Vergleichsgruppen, anhand derer die Aussagen zu den Klassenwiederholern abgesichert werden können, zu nennen. Die Autorinnen und Autoren begegnen diesem schwerwiegenden methodischen Problem durch den Einsatz des PSM-Verfahrens (Propensity Score Matching): Für Schülerinnen und Schüler, welche wiederholen, werden „Datenzwillinge“ jeweils derselben Schule gesucht, welche sich nur im Hinblick auf den Faktor „Klassenwiederholung“ unterscheiden und hinsichtlich potentiell relevanter Merkmale wie Alter, Geschlecht und Schulnoten möglichst ähnlich sind.

Die Autorinnen und Autoren gehen bei ihrer Untersuchung von zwei Annahmen aus:

  1. Leistungsschwache Wiederholende sollten sich im Hinblick auf ihre mathematische Kompetenz stärker verbessern als ähnlich leistungsschwache Schülerinnen und Schüler, die in die nächste Jahrgangsstufe versetzt wurden. Während letztere eventuell den Anschluss an den neuen Unterrichtsstoff verpasst hätten, gewännen Wiederholende Lernzeit durch die Verlängerung ihres Verbleibens in einer Stufe.
  2. Leistungsschwache Wiederholende sollten sich bezüglich ihrer mathematikbezogenen Motivationen und Einstellungen stärker verbessern als im Falle einer Versetzung. Dies könnte bedingt sein durch den geringeren Leistungsdruck, dem die Wiederholenden ausgesetzt seien, so dass sich diese mehr zutrauten. Auch ihre inzwischen größere Reife könnte eine Rolle spielen. Eine Verbesserung der Motivation könnte vor allem bei Schülerinnen und Schülern erfolgen, bei denen sich durch die Klassenwiederholung die Chance ergäbe, im Hinblick auf einen bevorstehenden Eintritt in die Berufswelt Kompetenzen zu erwerben oder zu vertiefen. Jedoch könnten Probleme durch den mit der Wiederholung verknüpften Wechsel der Peer-Group bestehen, vor allem, wenn es dabei zu einer Stigmatisierung der Wiederholenden komme.

Die Datenbasis der Untersuchung bilden die PISA-Studie 2012 und der IQB-Ländervergleich 2012 (einschließlich der Messwiederholungsstudie 2013). Die Datensätze enthalten Informationen zu mathematischen Kompetenzen und zu fachbezogenen motivationalen Einstellungen. Durch die Wiederholungsmessung können Veränderungen erkannt werden, sofern sich diese im Lauf eines Jahres ergeben haben.

Die mathematische Kompetenz wurde auf der Basis von 300 Testitems des IQB-Ländervergleichs bestimmt, dem die Bildungsstandards für die Sekundarstufe I zugrunde liegen. Demgegenüber wurden mathematikbezogene Motivationen und Einstellungen anhand von 5 Skalen des PISA-Fragebogens ermittelt (Arbeitseinstellung, Interesse für Mathematik, instrumentelle Motivation, mathematikbezogenes Verhalten, mathematikbezogene Selbstwirksamkeit). Mithilfe eines Fragebogens wurden zudem soziodemographische Angaben (Alter, Geschlecht, soziale Herkunft) erhoben sowie die Noten in den „Hauptfächern“ (Mathematik, Deutsch, Englisch) und den klassischen Naturwissenschaften (Biologie, Chemie, Physik). Unvollständige Datensätze der Fragebögen wurden auf der Basis eines FIML-Algorithmus („Full Information Maximum Likelihood“) ergänzt.

Die PISA-Studie umfasste ursprünglich 9.998 Schülerinnen und Schüler der 9. und 10. Jahrgangsstufe aus 222 Schulen unterschiedlicher Schultypen. Dieser Datensatz wurde nach den Erfordernissen der Untersuchung gefiltert: So wurden Hauptschulen, Berufsschulen und Förderschulen ausgeschlossen, da diese nicht durchgängig die 10. Jahrgangsstufe anbieten. Zudem wurden Lernende nicht berücksichtigt, bei denen keine Angaben zur Klassenstufe oder keine Testbefunde für das Fach Mathematik vorlagen. Das reduzierte die Fallzahlen auf 3.287 Schülerinnen und Schüler, von denen 106 die 9. Jahrgangsstufe wiederholten. Diese Datenmenge (n = 3.287) wird von der Autorengruppe als Gesamtstichprobe bezeichnet.

Das Problem, zu der Gruppe der Wiederholerinnen und Wiederholer eine Vergleichsgruppe zu konstruieren, wurde mit Hilfe des Propensity Score Matching-Verfahrens (PSM) gelöst. Hierbei wurde ermittelt, ob es auf der Schule, die der Wiederholer bzw. die Wiederholerin besucht, einen Schüler bzw. eine Schülerin gibt, welcher/welche zwar annähernd gleiche Werte in Bezug auf mathematische Ausgangsleistung, Schulnoten, mathematisches Selbstkonzept, ökonomischen, sozialen und kulturellen Status sowie Alter und Geschlecht aufweist, jedoch die Klasse nicht wiederholen musste, sondern versetzt wurde. Auf diese Weise gelang es, für 89 Wiederholende ein versetztes Gegenüber zu ermitteln, wobei die gefundenen Zwillinge im Durchschnitt lediglich im Hinblick auf die Mathematiknote einen geringen signifikanten statistischen Unterschied zu ihren Gunsten aufwiesen (ΔM =- ,40, p < 0.05).

Damit standen sich zwei Gruppen für einen same-age-Vergleich gegenüber, bei denen der Punkt „versetzt vs. nicht versetzt“ der entscheidende Unterschied war. Auf dieser Basis konnten die Effekte von Klassenwiederholungen auf die mathematische Kompetenz sowie mathematikbezogene Einstellungen und Motivationen mit Hilfe von Regressionsanalysen untersucht werden. Darüber hinaus stand die Gesamtstichprobe aller Schülerinnen und Schüler für diese Analysen zur Verfügung.

a) Mathematische Kompetenzen

Sowohl für die Wiederholenden als auch für ihre Vergleichsgruppe und die Gesamtstichprobe ergibt sich eine signifikante Verbesserung der mathematischen Kompetenzen im Laufe eines Jahres. Der Lernzuwachs der Wiederholenden ist allerdings nicht höher als bei der Vergleichsgruppe oder der Gesamtstichprobe. Trotz der angesichts geringer mathematischer Kompetenzwerte zu erwartenden Probleme für den Zeitraum nach der Versetzung gelingt es den Schülerinnen und Schülern der Vergleichsgruppe, einen spürbaren Kompetenzzuwachs zu erreichen.

b) Mathematikbezogene Motivation und Einstellungen

Bei mathematikbezogener Motivation und Einstellungen zeigen sich uneinheitliche Tendenzen:

Die Arbeitseinstellung der Wiederholenden verbessert sich gegenüber der Vergleichsgruppe und der Gesamtstichprobe im Zeitverlauf signifikant.

Hinsichtlich der anderen vier Aspekte von Motivation und Einstellung (Interesse für Mathematik, instrumentelle Motivation, mathematikbezogenes Verhalten, mathematikbezogene Selbstwirksamkeit) ergibt sich beim Vergleich der Wiederholenden und ihrer Zwillinge im Zeitverlauf jedoch teilweise gar keine Tendenz oder diese erweist sich als statistisch nicht signifikant.

In Bezug auf die eingangs formulierten Annahmen ergibt sich:

  1. Die Annahme, dass sich Wiederholende stärker verbessern könnten als regulär versetzte ähnlich leistungsschwache Schülerinnen und Schüler, bestätigt sich nicht. Im Hinblick auf das Ausmaß des Lernzuwachses führt eine Wiederholung also zu keinen signifikanten Vorteilen.
  2. Die Annahme, dass eine Wiederholung einen nachweisbaren positiven Effekt auf mathematikbezogene Motivation und Einstellungen haben könnte, ist nur für die Arbeitseinstellung zu belegen. Für die anderen vier Aspekte von Motivation und Einstellung ist kein Effekt signifikant abzusichern. Zumindest in Bezug auf das mathematikbezogene Selbstkonzept ist dies überraschend, da frühere Forschungen zumindest kurzfristig ein gesteigertes Selbstkonzept belegt hatten.

Vor dem Hintergrund individueller und gesellschaftlicher Kosten-Nutzen-Abwägungen kommen die Autorinnen und Autoren daher zu dem Fazit, dass Wiederholungen auf Einzelfälle zu beschränken seien und möglichst eine individuelle Förderung anzustreben sei.

Die Autorinnen und Autoren weisen in ihrer Untersuchung nach, dass Klassenwiederholungen nicht zu einem überdurchschnittlich starken Zuwachs an mathematischen Kompetenzen im Vergleich zur Versetzung führen und dass Wiederholende bezüglich fachbezogener motivationaler Aspekte lediglich eine bessere Arbeitseinstellung berichten. Allerdings führen sie einige Einschränkungen ihrer Ergebnisse und offene Punkte an:

  1. Da keine langfristigen Effekte untersucht werden konnten, bleibt unklar, ob der festgestellte positive Einfluss des Wiederholens auf die Arbeitseinstellung nachhaltig bestehen bleibt.
  2. Mithilfe des Propensity Score Matching (PSM) lassen sich für 89 Wiederholende Matchingpartner derselben Schule ermitteln, die sich nur im Hinblick auf den Punkt „Versetzung“ unterscheiden. Somit könnte es weitere versetzungsrelevante Schülermerkmale und Entscheidungsprozesse an den Schulen geben, welche über die in die Untersuchung eingehenden Punkte hinausgehen.
  3. Im Hinblick auf die instrumentelle Motivation raten die Autorinnen und Autoren dazu, die Untersuchung auf einen Zeitraum auszudehnen, in dem noch keine zusätzliche Motivation durch einen unmittelbar bevorstehenden Wechsel ins Berufsleben besteht, wie er für Schülerinnen und Schüler der 9. Jahrgangsstufe gegeben sein könnte.

Im Rahmen einer Rezension ergibt sich für die Untersuchung von Ehmke et al. jedoch noch aus anderen Gründen ein zwiespältiges Bild: Der Frage, ob eine Klassenwiederholung signifikante positive Auswirkungen auf Kompetenzzuwächse sowie Motivation und Einstellungen hat, kommt angesichts des schulischen Alltags höchste Relevanz zu. Auch der Versuch, mit Hilfe des PSM eine Vergleichsgruppe herzustellen, ist zu begrüßen, da hierdurch die Auswirkungen einer Klassenwiederholung sinnvoll abgeschätzt werden können.

Eine Schwäche der Untersuchung ergibt sich daraus, dass der ursächliche Zusammenhang zwischen dem hier näher betrachteten Fach Mathematik und der Tatsache des Wiederholens nicht eindeutig dargestellt wird. So wird nicht klar, ob bzw. bei wie vielen Schülerinnen und Schülern die Note im Fach Mathematik dazu beigetragen hat, dass die Klasse wiederholt werden muss. Die Beantwortung dieser Frage hätte eventuell unmittelbare Auswirkungen auf die Notwendigkeit von Kompetenzentwicklung und Motivation: Warum sollte ein Schüler, der z. B. aufgrund schlechter Noten in sprachlichen Fächern wiederholen muss, jedoch im Fach Mathematik ausreichende Leistungen aufweist, eine übermäßige Motivation für eine Kompetenzentwicklung in Mathematik entwickeln? Warum sollte andererseits ein Schüler mit leidlichen Leistungen in den meisten Fächern nicht eine besondere Motivation für einen Kompetenzaufbau im Fach Mathematik aufweisen, wenn dieses Fach in absehbarer Zukunft seine schulische Karriere gefährden könnte?

Es könnte also ein weiterer Filter in die Untersuchung eingebracht werden, der die Gruppe der Wiederholenden auf diejenigen Fälle beschränkt, bei denen eine schlechte Note im Fach Mathematik die Ursache für die Nichtversetzung war. Dann könnten allerdings die Fallzahlen auf ein Maß absinken, welches möglicherweise die Aussagekraft der Untersuchungen beeinträchtigen könnte.

Zudem ist unklar, ob der Versuch, den Kompetenzaufbau im Fach durch PISA- oder IQB-Tests zu erfassen, ein im Hinblick auf die Versetzung relevantes Bild der Verhältnisse wiedergibt. Im Schulalltag erfolgt die Kompetenzmessung neben schriftlichen Arbeiten, die den PISA- oder IQB-Tests noch am ehesten ähneln, aber meist viel stärker auf den Lehrstoff der letzten Wochen als auf die Rekonstruktion der langfristigen Kompetenzentwicklung abzielen, auch anhand des kaum mit den gängigen Tests erfassbaren Komplexes der „Sonstigen Mitarbeit“. PISA- und IQB-Tests dürften damit zum Teil Aspekte der Kompetenzentwicklung abbilden, die in dieser Form im realen Unterrichtsgeschehen weniger stark gefragt sind und umgekehrt. Das reale Unterrichtsgeschehen und die aus ihm hervorgegangenen Noten sind aber ursächlich für Versetzungsentscheidungen.

Die Mathematiknoten sind zudem nur einer von vielen Faktoren bei der Erstellung der Vergleichsgruppe mittels PSM. An dieser Stelle kann generell eine Kritik an der Konstruktion der Vergleichsgruppe ansetzen. Sind die darin eingehenden Faktoren wie soziale Herkunft, Geschlecht und Leistungen in sprachlichen Fächern wirklich notwendig, wenn die Kompetenz-, Motivations- und Einstellungsentwicklung für das Fach Mathematik ermittelt werden sollen? Ist dieses Konstruktionsverfahren vielleicht der Grund dafür, dass sich Wiederholer- und Vergleichsgruppe bereits zum Zeitpunkt der ersten Messung 2012 zumindest im Hinblick auf die Mathematiknoten unterscheiden, dass also evtl. Gruppen verglichen werden, die einander ausgerechnet am entscheidenden Punkt, den mathematischen Kenntnissen und Einstellungen, doch nicht so ähnlich sind, wie es zunächst erscheint?

Auch die Schlussfolgerung, Wiederholungen nur sehr dosiert einzusetzen und stattdessen auf individuelle Förderung zu vertrauen, ist angreifbar. Denn die Autorinnen und Autoren argumentieren hier, indem sie angesichts der geringen Folgen für die Kompetenz-, Motivations- und Einstellungsentwicklung die individuellen und gesellschaftlichen Kosten einer Wiederholung als zu hoch ansehen. Dem könnte entgegengehalten werden, dass ja auch im regulären Unterricht eine Individualisierung stattfinden kann und soll, so dass die Schüler die Kompetenzen möglicherweise trotz bereits bestehender individueller Förderung nicht entwickelten. Alle über den regulären Unterricht hinausgehenden individuellen Fördermaßnahmen aber verursachen ebenfalls individuelle und gesellschaftliche Kosten. Eine detaillierte Abwägung zwischen den Kosten und dem Nutzen individueller Fördermaßnahmen und der Vergleich mit Kosten und Nutzen von Klassenwiederholungen täte also not, um zu einem faktengestützten Fazit zu kommen.

Rezension speichern und teilen
Unterstützung für die Praxis

nrw-wappenSchulentwicklung NRW

Diese Rezension wurde erstellt von:
Dr. Heinz Sander, Lehrer am Gymnasium der Stadt Kerpen – Europaschule und Privatdozent an der Universität zu Köln

Sie haben Fragen oder Anregungen?

Schreiben Sie uns!