Funktionieren Prüfungen am Bildschirm genauso gut wie auf dem Papier?

Kann man Kindern heute digitale Tests zumuten oder bringen die im Vergleich zu der klassischen Variante Nachteile mit sich? Dazu hat Dr. Ramona Lorenz von der TU Dortmund geforscht.

„Screen Inferiority“ – auf Deutsch: die Unterlegenheit des Bildschirms. So wurde in der Forschung bisher beschrieben, dass es sich am Bildschirm schwieriger liest als vom Papier. Aber ist das heute immer noch der Fall? Dr. Ramona Lorenz von der TU Dortmund hat dazu im Prüfungskontext geforscht – und berichtet von ihren Ergebnissen im Interview.

Redaktion: Frau Dr. Lorenz, in Ihrem Forschungsprojekt zum Thema Lern- und Leistungssituationen im Kontext der Digitalisierung” beschäftigen Sie sich unter anderem mit digitalen und papierbasierten Testverfahren. Was wollten Sie hierbei herausfinden? Welchen Forschungsfragen gehen Sie nach?

Dr. Ramona Lorenz: Im neuesten Teil unserer Studie geht es um das Lesen in der Grundschule in Leistungssituationen. Hier haben wir anhand einer Stichprobe von Viertklässlerinnen und Viertklässlern in Nordrhein-Westfalen geschaut, wie sich der Einsatz digitaler Testformate im Vergleich zu papierbasierten Formaten auf verschiedene Aspekte auswirkt. Dabei hatten wir vor allem die kognitiven Anforderungen an die Schülerinnen und Schüler im Blick. Die Frage war also unter anderem: Ist es für sie eine höhere kognitive Belastung, an digitalen Medien einen Test zu bearbeiten?

Redaktion: Und bei den computerbasierten Tests haben Sie nochmals genauer unterschieden.

Lorenz: Ja, wir haben bei den computerbasierten Tests zwei Versionen mit jeweils 25 Fragestellungen, sogenannten Items, unterschieden. Eine Version hatte eine vorher festgelegte Reihenfolge von Items, ähnlich wie bei papierbasierten Tests. Die zweite Variante war ein adaptiver Test, der die gestellten Leseaufgaben im Laufe des Tests an die Fähigkeiten der Schülerinnen und Schüler anpasst. Am Ende konnten wir diese beiden Testvarianten, die jeweils 30 Minuten lang waren, miteinander vergleichen.

Redaktion: Was kam dabei heraus?

Lorenz: Wir haben festgestellt, dass sich die kognitive Belastung zwischen den Formaten unterschieden hat. Allerdings nicht so sehr zwischen dem papierbasierten und computerbasierten Testformat. Vielmehr zeigten insbesondere die adaptiven Tests einen höheren Anstieg der Belastung für die Schülerinnen und Schüler im Vergleich zu den festgelegten Item-Reihenfolgen. Je mehr Aufgaben bearbeitet wurden, desto mehr stieg die kognitive Belastung an, und dies in höherem Maße im adaptiven Testformat. Wir haben auch gesehen, dass die Schülerinnen und Schüler eine höhere Motivation aufwiesen, den Test am Tablet zu bearbeiten als bei der Papierversion.

Redaktion: Warum, glauben Sie, ist die kognitive Belastung bei dem angepassten Text größer?

Lorenz: Die kognitive Belastung der Schülerinnen und Schüler ist bei den adaptiven Tests größer – weil sich der Test an das Leistungsniveau anpasst. Es sind also weniger einfach zu bearbeitende Aufgaben enthalten. Wenn man aus test-theoretischer Sicht auf das Ergebnis schaut, lässt sich feststellen, dass man beim adaptiven Test auch schon mit einem kürzeren Test den gleichen Informationsgewinn über das Leistungsniveau einer Schülerin oder eines Schülers erreicht. Man könnte also über einen kürzeren Leistungstest dann wiederum die Belastung für die Schülerinnen und Schüler reduzieren.

„Für Lehrkräfte ist es sicher hilfreich zu wissen, dass wir aus Forscherperspektive keine nennenswerten Vorbehalte gegen den Einsatz von digitalen Geräten in Testsituationen sehen.“

Dr. Ramona Lorenz

Redaktion: Sie konnten in Ihrer Forschungsarbeit den schon mehrfach in der Forschung belegten screen inferiority”-Effekt, dass es sich am Bildschirm also schwieriger liest als vom Papier, nicht nachweisen. Woran glauben Sie, liegt das?

Lorenz: Wir haben im Design des Tests sehr darauf geachtet, dass die Darstellungsweisen am Bildschirm und auf dem Papier möglichst identisch sind. Das heißt, es musste nicht gescrollt werden, es gab keine Hyperlinks oder ähnliches in den Tests. Die eine Gruppe saß an einem Din-A-5-Blatt im Querformat, die andere an einem entsprechenden Tablet. Dies war in früheren Forschungsarbeiten sicher nicht immer der Fall. Zum Teil musste beim Lesen gescrollt werden, der Text wurde auf mehreren Seiten Papier abgedruckt, die Bildschirmauflösung war noch auf einem anderen Niveau als heute. Wir wollten diese Faktoren sehr kontrolliert halten, um auch den Unterschied zwischen dem adaptiven Test und dem Verfahren mit festgelegter Reihenfolge zu sehen. Man muss hier auch sagen, dass es bisher in diesem Bereich sehr wenige Befunde für den Grundschulbereich gibt. Und die älteren Befunde muss man aus dem Blick des heutigen technologischen Standes etwas anders bewerten. Dennoch zeigen auch aktuelle Befunde, gerade was das tiefere Leseverständnis betrifft, dass dies auch heute noch am Papier besser gelingt als an digitalen Geräten. Insgesamt muss man sich bewusst machen, dass viele Einflussfaktoren in den Leseprozess mit hineinspielen, etwa das Alter der lesenden Person, die Vertrautheit mit dem Gerät, oder wie linear ein Text sich lesen lässt, ob er etwa durch andere Elemente wie Bilder, Tabellen oder Infoboxen unterbrochen wird.

Redaktion: Welche praktischen Konsequenzen für den Alltag der Lehrkräfte sehen Sie in Ihrer Forschungsarbeit? 

Lorenz: Für Lehrkräfte ist es sicher hilfreich zu wissen, dass wir aus Forscherperspektive keine nennenswerten Vorbehalte gegen den Einsatz von digitalen Geräten in Testsituationen sehen – vorausgesetzt der Test ist nicht schwieriger, weil ein entsprechendes Navigieren, Klicken und ähnliche Aktivitäten, mit denen die Schülerinnen und Schüler nicht vertraut sind, vonnöten ist. Bei Verfahren, mit denen die Schülerinnen und Schüler vertraut sind, sind die digitalen Tests im Vergleich zu papierbasierten Varianten sehr ähnlich, was die kognitive Belastung der Schülerinnen und Schüler angeht, und es finden sich kaum Effekte, etwa bezüglich der Angst vor einem Test. Wie es sich bei mehrseitigen Tests mit längeren Texten verhält, die potentiell nochmals andere Belastungen hervorrufen, ist allerdings noch eine offene Forschungsfrage.

Redaktion: Frau Doktor Lorenz, wir danken Ihnen für dieses Gespräch.

Zur Person

Dr. Ramona Lorenz arbeitet am Institut für Schulentwicklungsforschung der TU Dortmund. Ihre Forschungsschwerpunkte umfassen Empirische Schul- und Unterrichtsforschung, digitale Medien in Schule und Unterricht, Leseleistungen von Schülerinnen und Schülern und die neue Steuerung und zentrale Prüfungsformate in der Schule.