Vierjährige auf dem Prüfstand: Wie aussagekräftig sind frühe Sprachdiagnosen?

Messbare Sprachkompetenz oder Diagnosefehler? Über die Grenzen und das Verbesserungspotential standardisierter Verfahren im Vorschulalter

Wie zuverlässig sind Sprachtests im Vorschulalter und welche Folgen haben sie für Kinder, Eltern und Fachkräfte? Gängige Diagnoseverfahren zeigen erhebliche Schwächen, führen zu Fehldiagnosen bei Mehrsprachigkeit und machen deutlich: Gute Sprachstandserhebungen brauchen Zeit, Ressourcen und kindgerechte Konzepte.

Bundesbildungsministerin Karin Prien plädiert für eine flächendeckende verpflichtende Sprachstandserhebung für alle Kinder im Alter von vier Jahren. Dies soll sicherstellen, dass alle Kinder bei der Einschulung ausreichend Deutsch können und bei Bedarf frühzeitig gefördert werden. Die Idee ist nicht neu und wissenschaftlich fundiert: Die fundamentale Bedeutung früher sprachlicher Kompetenzen für den weiteren Bildungsweg und die gesellschaftliche Teilhabe ist wissenschaftlich unbestritten. Tatsächlich existieren in den Bundesländern bereits diverse Verfahren zur Sprachdiagnostik im Vorschulalter – allerdings uneinheitlich und mit unterschiedlicher Konsequenz. Während beispielsweise Hamburg seit 2005 flächendeckend den Sprachstand aller Viereinhalbjährigen erfasst, fanden in Bayern im März 2025 erstmals entsprechende Tests statt. Angesichts der Pläne und bisherigen Erfahrungen stellt sich die Frage: Wie aussagekräftig, zuverlässig und letztlich sinnvoll sind Sprachtests für Vorschulkinder eigentlich?

Sprachförderbedarf – wie gut kann er wirklich gemessen werden?

Bei Vierjährigen Sprachprobleme exakt zu diagnostizieren und daraus passende Förderungsmaßnahmen abzuleiten ist gar nicht so leicht, wie es vielleicht auf den ersten Blick scheint. Tatsächlich unterstreichen viele wissenschaftliche Untersuchungen, wie wackelig die Aussagekraft von Sprachtests bei vierjährigen Kindern sein kann (Wolf et al. 2015, Kiese-Himmel 2022). Eine Expertise für das Bundesfamilienministerium (Anders et al. 2022) bestätigt, dass "die eingesetzten Sprachstandsverfahren in den Bundesländern Qualitätsmängel hinsichtlich verschiedener Qualitätsmerkmale aufweisen (vor allem in Bezug auf die Berücksichtigung sprachlicher Basisqualifikationen, Validität, Objektivität sowie Mehrsprachigkeit)". Sie seien „nicht immer wissenschaftlich auf ihre Qualität und Wirksamkeit geprüft“ worden.

Viele Tests erfassen zwar relativ zuverlässig Teilaspekte wie Sprachverstehen oder Wortschatz, liefern aber keine differenzierten Informationen zur gesamten Sprachentwicklung. Sie markieren Kinder lediglich als „Risikokinder" für Sprachentwicklungsstörungen, wenn sie bestimmte Schwellenwerte unterschreiten. Sprachscreenings können zwar Beobachtungsverfahren und informelle Urteile übertreffen,  zeigen dennoch auch immer wieder gravierende Fehleinschätzungen. Es ist wissenschaftlich umstritten, ob diese Verfahren tatsächlich valide den langfristigen Förderbedarf erfassen können – also wirklich die Kinder identifizieren, die anhaltende Unterstützung benötigen.

Besondere Fehldiagnose-Gefahr bei mehrsprachigen Kindern

Insbesondere bei mehrsprachigen Kindern, die Deutsch als Zweitsprache (DaZ) lernen, besteht die Gefahr, dass Tests, die an einsprachigen Normen ausgerichtet sind, zu viele mehrsprachige Kinder als „auffällig“ einstufen. Mehrere Studien zeigen, dass ihre unmodifizierte Anwendung bei mehrsprachigen Kindern ein hohes Risiko der Fehldiagnose birgt, insbesondere einer Überdiagnose von Förderbedarfen. So zeigt etwa eine internationale Studie von Altman et al. (2022) mit 443 mehrsprachigen Kindern mit verschiedenen Zweitsprachen, darunter viele mit Deutsch als Zweitsprache, dass 53 Prozent der Kinder überdiagnostiziert worden wären, wäre ihr Sprachstand unreflektiert mittels einsprachiger Testverfahren beurteilt worden.

Phänomene, die typisch für den Zweitspracherwerb sind – wie ein temporär geringerer Wortschatz in der Zweitsprache, grammatikalische Interferenzen aus der Erstsprache oder eine "stille Phase" – können fälschlicherweise als Symptome einer Störung interpretiert werden. Und das hat teils erhebliche Folgen: Eine fehlerhafte Diagnose kann entweder dazu führen, dass mehrsprachige Kinder mit einer tatsächlichen Sprachentwicklungsstörung keine adäquate therapeutische Unterstützung erhalten, oder dass sich normal entwickelnde DaZ-Kinder unnötigerweise pathologisiert und stigmatisiert werden, was ihre Lernmotivation und ihr Selbstbild negativ beeinflussen kann.

Koordinatorische und logistische Mammutaufgabe

Doch nicht nur die Präzision der Tests, sondern auch der erhebliche organisatorische und logistische Aufwand bei ihrer Durchführung verursachen ernsthafte Probleme, wie zuletzt am Beispiel Bayern deutlich wurde. Hier mussten 2400 Grundschulen in diesem Jahr innerhalb weniger Wochen Sprachstandserhebungen organisieren – vielerorts lief die Vorbereitung Berichten zufolge chaotisch ab:Einige Schulen erhielten etwa keine verständlichen Musteranschreiben und formulierten selbst seitenlange Elternbriefe, die viele Familien überforderten. Der Bayerische Lehrer- und Lehrerinnenverband (BLLV) bezeichnete die Situation als "bürokratischen Irrsinn".

Über 20 Jahre lang gewachsen sind Sprachstanderhebungen dagegen in der Stadt Hamburg, in der jährlich mehr als 17.000 Kinder im Alter von viereinhalb Jahren zu diesen Erhebungen eingeladen und getestet werden. Dieser Prozess erfordert umfangreiche Koordination, die die Terminplanung für eine große Anzahl von Kindern, die Bereitstellung geeigneter Räumlichkeiten, die Verteilung von Testmaterialien und eine intensive, oft mehrsprachige Kommunikation mit den Eltern umfasst. Die Entwicklung solch komplexer Systeme ist ein langwieriger Prozess – von heute auf morgen in großen Flächenländern entsprechend qualitativ hochwertige Testinfrastrukturen aufzubauen, erfordert entsprechend eine sehr sorgfältige, ressourcenbasierte Planung.

Personelle Überlastung und Qualifikation des Testpersonals

Und Ressourcen sind im deutschen Bildungssystem seit langem knapp. Entsprechend ist eine der gravierendsten Herausforderungen für bundesweit verpflichtende Sprachtests die massive zusätzliche Arbeitsbelastung für das pädagogische und schulpsychologische beziehungsweise beratende Personal, das mit der Durchführung der Erhebungen betraut wird. Eine vom BLLV im Frühjahr 2025 in Bayern durchgeführte Umfrage unter 273 Testleitungen (überwiegend Beratungslehrkräfte und Schulpsycholog:innen) offenbarte fragwürdige Zustände: 90 Prozent der Befragten gaben an, die Testungen nicht im Rahmen ihrer regulären Arbeitszeit durchführen zu können, sondern diese zusätzlich leisten zu müssen. Für die Testungen erhielten 39 Prozent der Beratungslehrkräfte und 68 Prozent der Schulpsycholog:innen zudem keine Anrechnungsstunden.

Darüber hinaus ist die Qualifikation des durchführenden Personals ein entscheidender Faktor für die Güte und Verlässlichkeit der diagnostischen Ergebnisse. Es bedarf umfassender Schulungen, so dass nicht nur die spezifischen Testverfahren sicher und standardisiert angewendet werden können, sondern auch die notwendige Sensibilität im Umgang mit sehr jungen Kindern und deren oft verunsicherten Familien erreicht wird. Die Notwendigkeit einer kindgerechten, vertrauensvollen Atmosphäre kann unter dem Druck hoher Fallzahlen und knapper Zeitressourcen leicht in den Hintergrund treten. Und auch das kann diagnostisch erhebliche Folgen haben.

Der Einfluss der Testbedingungen

Kommt es während der Sprachstandserhebung zu Momenten, in denen das Kind zum Beispiel unsensibel behandelt und so verunsichert wird, helfen auch theoretisch hochwertige Testverfahren nicht mehr. Denn in der konkreten Testsituation können viele solcher Faktoren die Leistung eines Kindes negativ beeinflussen und somit die Ergebnisse verfälschen.

Dazu zählen kindbezogene Aspekte wie Schüchternheit, Ängstlichkeit, mangelnde Aufmerksamkeit, Müdigkeit oder Unwohlsein. Aber eben auch umgebungsbedingte Faktoren: Ein ungewohnter Raum, eine fremde Testperson, Zeitdruck oder eine nicht kindgerechte Atmosphäre können dazu führen, dass Kinder ihr tatsächliches sprachliches Potenzial nicht zeigen. Die vom BLLV geäußerte Kritik, dass die Tests in Bayern etwa bei vielen Kindern und Eltern einen "schlechten Ersteindruck von Schule" hinterlassen, deutet auf solche suboptimalen Testbedingungen hin.

Vorsicht vor Stigmatisierung: die Folgen früher Etikettierung

Neben den methodischen und praktischen Problemen werfen verpflichtende Sprachtests auch erhebliche Bedenken hinsichtlich des kindlichen Wohlbefindens auf. Wissenschaftliche Studien belegen, dass Kinder mit Sprachentwicklungsstörungen ein erhöhtes Risiko für psychosoziale Probleme wie Ausgrenzung und Mobbing tragen. Eine deutsche Studie von 2018 fand heraus, dass sich fast 40 Prozent der betroffenen Kinder selbst als Mobbing-Opfer sehen, eine Untersuchung der Universität Bremen (2016) bestätigt ein erhöhtes Risiko für Ängste, sozialen Rückzug und Schwierigkeiten im Aufbau von Freundschaften.  

Die entscheidende Kritik setzt jedoch genau hier an: Während diese Fakten für eine frühzeitige Hilfe sprechen, kann der Prozess der Diagnose selbst zum Problem werden. Die formale Konfrontation mit einem Test und die anschließende Etikettierung als „sprachauffällig“ können für ein junges Kind und seine Familie eine erhebliche Belastung darstellen. Das Risiko der Stigmatisierung ist real; so berichten zwei Drittel der Eltern von Kindern mit Sprachentwicklungsstörungen von stigmatisierendem Verhalten aus dem sozialen Umfeld. 

Diese Gefahr wird verstärkt, wenn die Testsituation von den Kindern als defizitorientierte „Fehlersuche“ wahrgenommen wird anstatt als unterstützende Bestandsaufnahme. Das größte Problem entsteht jedoch, wenn auf eine Diagnose keine adäquate und ressourcenstarke Förderung folgt. Kritiker, wie der Bayerische Lehrer- und Lehrerinnenverband, warnen davor, dass die Diagnostik dann zu einem „teuren Feigenblatt“ wird. Anstatt den Weg zu ebnen, hinterlässt das Label „Förderbedarf“ dann möglicherweise nur reduzierte Erwartungen und einen „schlechten Ersteindruck von Schule“, ohne die versprochene Hilfe zu leisten. Die Herausforderung besteht also nicht nur darin, Kinder zu identifizieren, sondern dies auf eine Weise zu tun, die nicht stigmatisiert und die zwingend an eine garantierte, qualitativ hochwertige Förderung gekoppelt ist.

Wichtige Elemente erfolgreicher frühkindlicher Sprachtests

Die wissenschaftliche Evidenz zu Sprachstandserhebungen im Vorschulalter zeigt: Es braucht einen fundierten, gut geplanten Ansatz, um valide und kindgerechte Ergebnisse zu erzielen. Erfolgreiche Modelle aus verschiedenen Bundesländern demonstrieren, wie eine solche qualitativ hochwertige Sprachdiagnostik aussehen kann:

1. Kindgerechte und vertrauensvolle Durchführung
Entscheidend für aussagekräftige Ergebnisse ist eine kindgerechte Gestaltung der gesamten Prüfungssituation. So wird im Rahmen des Hamburger "Vorstellungsverfahrens Viereinhalbjähriger" bewusst das Wort “Test” vermieden und eine positive und angstfreie Atmosphäre geschaffen, um den Leistungsdruck für die Kinder zu minimieren. Dieser pädagogische Ansatz soll sicherstellen, dass Kinder nicht verunsichert verstummen, sondern ihr volles sprachliches Können zeigen. Wissenschaftliche Erkenntnisse bestätigen, dass die Qualität der Beziehung zwischen der durchführenden Fachkraft und dem Kind die Ergebnisse maßgeblich beeinflusst. Eine einfühlsame und vertrauensvolle Interaktion ist damit nicht nur ein pädagogisches Ideal, sondern eine Voraussetzung für die wissenschaftliche Gültigkeit der Messung.   
Moderne Ansätze nutzen Technologie, um Kindgerechtheit und Standardisierung zu verbinden. Das SCREENIKS-Verfahren beispielsweise ist als kindgerechtes Computerspiel konzipiert, das die Bereitschaft zur Mitarbeit erhöht und gleichzeitig für alle Kinder exakt gleiche Testbedingungen sicherstellt. Die Auswertung erfolgt automatisiert binnen Sekunden und basiert auf statistischen Vergleichswerten, die für ein- und mehrsprachige Kinder getrennt normiert wurden. Dies verbessert sowohl die Fairness als auch die Effizienz der Überprüfung erheblich.   


2. Systematischer Aufbau und wissenschaftlich fundierte Verfahren
Erfolgreiche Bundesländer wie Hamburg oder Baden-Württemberg setzen auf planvoll aufgebaute, mehrstufige Systeme statt auf isolierte Einzeltests. Hamburg hat sein Verfahren seit 2005 kontinuierlich weiterentwickelt und erfasst damit heute jährlich über 17.000 Kinder. Solche Systeme kombinieren verschiedene Instrumente zu einem effizienten diagnostischen Ökosystem. Den Auftakt bilden oft ressourcenschonende Screenings für alle Kinder, ergänzt  durch die kontinuierliche Beobachtung im Kita-Alltag durch geschulte pädagogische Fachkräfte. Verfahren wie BaSiK in Nordrhein-Westfalen oder das neue BeoKiz-Verfahren in Berlin (das seit 2024 das vielfach kritisierte Sprachlerntagebuch abgelöst hat) ermöglichen es, die Sprachentwicklung der Kinder prozessbegleitend im pädagogischen Alltag zu dokumentieren.

Nur bei Kindern, bei denen im ersten Schritt ein Förderbedarf vermutet wird, kommen in einem weiteren Schritt gezielte, standardisierte Testverfahren wie HAVASE 4-8 in Hamburg oder der SETK 3-5 zum Einsatz. Diese Instrumente erlauben eine detaillierte Analyse der sprachlichen Fähigkeiten und bilden die Grundlage für eine passgenaue Förderplanung. Diese Kombination aus breiter Beobachtung und gezielter Testung stellt sicher, dass Ressourcen fokussiert und Kinder nicht unnötig belastet werden.

3. Weiterbildung der Fachkräfte und Zusammenarbeit mit Familien
Eine entscheidende Grundlage für den Erfolg ist die fundierte Qualifizierung der beteiligten Fachkräfte. Baden-Württemberg investiert etwa mit dem Kolibri-Programm gezielt in die Professionalisierung und schult Sprachförderkräfte verbindlich unter anderem nach dem wissenschaftlich fundierten Konzept "Mit Kindern im Gespräch". Dieses Qualifizierungsprogramm wird auch in Rheinland-Pfalz genutzt, um Fachkräften zu helfen, durch gezielte Frage- und Rückmeldestrategien die alltäglichen Gespräche mit Kindern sprachförderlicher zu gestalten.

Zentral ist außerdem eine enge und partnerschaftliche Zusammenarbeit mit den Familien. Vorbildliche lokale Zusammenarbeit wie etwa im “Nienburger Modell” im niedersächsischen Landkreis Nienburg zeigen, wie eine funktionierende Kooperationskultur zwischen Landkreis, Kita, Schule und Elternhaus etabliert werden kann. In diesem Rahmen werden Eltern als wichtige Partner für die Sprachentwicklung ihrer Kinder verstanden und ihre Kompetenzen, auch in den Herkunftssprachen, als wertvolle Ressource anerkannt und wertgeschätzt. Das bedeutet etwa, dass Fachkräfte regelmäßige Entwicklungsgespräche anbieten und die Eltern bei Bedarf in die Förderplanung einbeziehen. Die Zusammenarbeit basiert auf gegenseitigem Vertrauen und dem Ziel, Verunsicherung und Stigmatisierung zu vermeiden und das Kind gemeinsam in seiner Entwicklung zu einer selbstbewussten Persönlichkeit zu begleiten.
 

Auf das, was nach den Tests passiert, kommt es an

Bildungsforscherinnen und Bildungsforscher sind sich einig, dass verpflichtende Sprachstandserhebungen überhaupt nur dann wirksam sind, wenn sie früh genug erfolgen (mindestens ein Jahr vor Schuleintritt) – und unmittelbar in passgenaue Fördermaßnahmen münden. Doch ähnlich wie die Sprachtests variiert die eingesetzte Förderung in den Bundesländern stark. Das Spektrum reicht von hochstrukturierten, verpflichtenden Programmen bis hin zu Ansätzen, die stark auf die Eigenverantwortung der Kitas und die Integration in den Alltag setzen. Das Online-Magazin schulmanagement wird die eigentlichen Fördermaßnahmen und worauf es bei diesen ankommt, in einem späteren Artikel beleuchten.