2026-06-08

Multiple-Choice vs. aktiver Abruf beim Vokabellernen

Multiple-Choice-Tests fühlen sich produktiv an, können aber falsche Antworten im Gedächtnis verankern. Aktiver Abruf durch Tippen baut stärkere Vokabelkenntnisse auf.

Kurz gesagt

Multiple-Choice-Tests gehören zu den schwächsten Formaten für das Vokabellernen. Sie testen Wiedererkennung (die richtige Option aus einer Liste auswählen) statt Abruf (das Wort aus dem Gedächtnis produzieren), und die falschen Antwortoptionen können fehlerhafte Verknüpfungen in deinem Gedächtnis anlegen. Roediger und Marsh (2005) zeigten diesen "Negative Suggestion Effect": Wenn Testteilnehmer einen falschen Distraktor wählen, produzieren sie diese falsche Antwort mit höherer Wahrscheinlichkeit bei einem späteren freien Abruftest.¹ Allein das Lesen plausibler falscher Antworten kann dein Gedächtnis für die richtige kontaminieren.

Für dauerhaftes, anwendbares Vokabelwissen ist getippter oder geschriebener aktiver Abruf, bei dem du das Wort ohne Auswahlmöglichkeiten aus dem Gedächtnis produzierst, Multiple-Choice in kontrollierten Studien durchgehend überlegen.² Je grösser die Abrufanstrengung, desto stärker die resultierende Gedächtnisspur. Deshalb setzt LinGoat auf getippte Satzproduktion und FSRS-basierte Spaced Repetition statt auf Multiple-Choice-Quiz.

Der Testeffekt: Nicht alle Tests sind gleich

Der Testeffekt ist einer der robustesten Befunde der kognitiven Psychologie: Das Abrufen von Information aus dem Gedächtnis stärkt diese Erinnerung weit mehr als blosses Wiederlesen.² Karpicke und Roediger (2008) fanden heraus, dass Studierende, die Abrufübungen machten, nach einer Woche dramatisch mehr Material behielten als solche, die nur wiederholend lasen, selbst wenn die Wiederlese-Gruppe mehrere zusätzliche Lernsitzungen hatte.

Aber das Format des Tests zählt. Robert Bjorks "Desirable Difficulties"-Rahmenwerk erklärt warum: Lernen ist am dauerhaftesten, wenn der Abruf echte Anstrengung erfordert.³ Eine Multiple-Choice-Frage mit vier Optionen reduziert das Problem auf Wiedererkennung und Ausschlussverfahren. Ein leeres Textfeld, das dich zwingt, die Antwort von Grund auf zu produzieren, verlangt vollständigen Abruf. Das schwierigere Format erzeugt stärkere, flexiblere Gedächtnisspuren.

Warum Multiple-Choice beim Vokabellernen versagt

Der Lure-Effekt: Falsche Optionen kontaminieren das Gedächtnis

Das schädlichste Problem bei Multiple-Choice ist der sogenannte "Negative Suggestion Effect" oder Lure-Effekt. Wenn du vier Optionen liest und eine auswählst, verarbeitest du alle vier. Wählst du falsch, oder wählst du richtig, hast aber eine falsche Option ernsthaft in Betracht gezogen, wird diese falsche Verknüpfung neben der richtigen kodiert.¹

Beim Vokabellernen ist das besonders schädlich. Stell dir eine Frage vor: "Was bedeutet renard? (a) Fuchs (b) Ente (c) Hirsch (d) Kaninchen." Selbst wenn du richtig wählst, hast du "renard" nun im Gedächtnis mit Ente, Hirsch und Kaninchen verknüpft. Beim späteren freien Abruf konkurrieren diese falschen Assoziationen mit der richtigen. Roediger und Marsh fanden heraus, dass Teilnehmer, die Multiple-Choice-Tests absolvierten, bei Folgetests tatsächlich mehr Lure-basierte Fehler produzierten als Teilnehmer, die gar nicht getestet worden waren.¹

Feedback hilft, beseitigt das Problem aber nicht. Butler und Roediger (2008) zeigten, dass korrektes Feedback nach jeder Multiple-Choice-Frage Lure-Intrusionen reduzierte, der Negative Suggestion Effect aber selbst bei sofortigem Feedback in gewissem Mass bestehen blieb.⁴

Wiedererkennung ist nicht Abruf

Multiple-Choice-Tests verlangen nur, die richtige Antwort unter Distraktoren wiederzuerkennen. Wiedererkennung ist kognitiv einfacher als Abruf: Dein Gehirn gleicht Muster mit den dargebotenen Optionen ab, statt die Antwort selbst zu generieren. Das bedeutet, MC-Tests überschätzen systematisch, was du tatsächlich kannst. Du "kennst" ein Wort vielleicht in einem Vier-Optionen-Quiz, versagst aber völlig, wenn du es im Gespräch oder beim Schreiben produzieren sollst.

Carrier und Pashler (1992) verglichen Multiple-Choice-Tests direkt mit Cued Recall (die Antwort aus einem minimalen Hinweis produzieren) und stellten fest, dass Cued Recall signifikant bessere Langzeitretention erzeugte.⁵ Das Generieren der Antwort, nicht das Auswählen, treibt dauerhaftes Lernen an. Einen tieferen Einblick, warum erkennungsbasiertes Üben eine Lücke in der produktiven Fähigkeit hinterlässt, findest du in unserem Artikel über passiven vs. aktiven Wortschatz.

Abrufstärke, Speicherstärke und wünschenswerte Schwierigkeit

Bjork und Bjorks "Theory of Disuse" bietet eine nützliche Perspektive, um zu verstehen, warum Multiple-Choice und freier Abruf so unterschiedliche Lernergebnisse produzieren.³ Jede Erinnerung hat zwei unabhängige Eigenschaften:

Speicherstärke: wie tief das Item kodiert ist. Diese steigt mit sinnvollem Lernen und nimmt nicht mit der Zeit ab.
Abrufstärke: wie leicht du auf das Item gerade zugreifen kannst. Diese schwankt und verfällt ohne Übung.

Multiple-Choice-Fragen trainieren Wiedererkennung, die nur moderate Abrufstärke erfordert. Du siehst die Antwort und bestätigst eine Übereinstimmung. Freier Abruf erfordert hohe Abrufstärke: Du musst die Antwort ohne externen Hinweis aus dem Gedächtnis ziehen. Erfolgreicher Abruf steigert sowohl Abruf- als auch Speicherstärke erheblich.

Deshalb erzeugt Multiple-Choice eine Illusion der Beherrschung. Die Speicherstärke des Worts mag wachsen (du hast es mehrmals gesehen), aber die Abrufstärke bleibt niedrig, weil du nie vollständigen Abruf geübt hast. Wenn du das Wort im echten Gespräch oder beim Schreiben brauchst, ohne Optionen zur Auswahl, scheitert der Abruf. Die "wünschenswerte Schwierigkeit", eine Antwort von Grund auf zu produzieren, baut genau die Abrufpfade auf, die du für den realen Einsatz brauchst. Mehr dazu, wie Spaced-Repetition-Planung mit Gedächtnisstärke interagiert, findest du in unserem Leitfaden zur Funktionsweise von Spaced Repetition.

Der Produktionseffekt: Warum Tippen die Kodierung stärkt

Über den Abruf hinaus erzeugt das physische Produzieren eines Worts (Tippen, Schreiben oder Sprechen) eine reichere Gedächtnisspur als passives Auswählen. MacLeod und Kollegen (2010) dokumentierten den "Production Effect": Wörter, die Teilnehmer laut aussprachen, wurden erheblich besser erinnert als Wörter, die sie still lasen, selbst bei gleicher Gesamtlernzeit.⁶

Dasselbe Prinzip gilt fürs Tippen. Wenn du ein Wort oder einen Satz tippst, aktivierst du motorische Planung, Buchstabe-für-Buchstabe-Sequenzierung und orthographische Verarbeitung, die das Klicken eines Multiple-Choice-Buttons nie auslöst. Jeder zusätzliche Kodierungskanal (motorisch, visuell, phonologisch) schafft mehr Abrufpfade und macht die Erinnerung robuster und aus verschiedenen Kontexten zugänglich.

Beim Vokabellernen erzwingt Produktion speziell die Aufmerksamkeit auf die Form: Rechtschreibung, Akzentzeichen, grammatische Endungen. Ein Multiple-Choice-Test lässt dich "hablaron" als korrekt erkennen, ohne zu bemerken, dass es sich von "hablaran" nur durch einen Vokal unterscheidet. Tippen zwingt dich, jeden Buchstaben zu produzieren, und stärkt dein Wissen über morphologische Details. Mehr zum Thema Satzübungen vs. Lückentextformate findest du in unserem Artikel über Nachteile von Cloze-Karten.

Wann Multiple-Choice trotzdem helfen kann

Trotz seiner Einschränkungen beim Vokabelerwerb ist Multiple-Choice nicht ohne Wert. Forschung deutet auf zwei Szenarien hin, in denen es beitragen kann:

Verständnistests und Einstufung: MC-Tests sind effizient, um rezeptives Wissen über viele Items hinweg zu messen. Wenn das Ziel ist, zu bewerten, wie viele Wörter ein Lernender erkennt (nicht produziert), ist MC schnell und skalierbar. Standardisierte Einstufungstests nutzen MC genau aus diesem Grund.
Sehr früher Kontakt mit unbekanntem Material: Little, Bjork, Bjork und Angello (2012) fanden heraus, dass Multiple-Choice-Tests in Kombination mit Feedback Lernen fördern können, besonders bei Material, dem der Lernende kaum begegnet ist.⁷ Im frühesten Lernstadium kann MC als niedrigschwelliger erster Kontakt dienen, bevor aktiver Abruf übernimmt. Der Lure-Effekt bleibt jedoch auch hier ein Problem, und Lernende sollten so schnell wie möglich zu produktionsbasiertem Üben übergehen.

Die zentrale Unterscheidung ist zwischen Bewertung und Lernen. MC kann messen, was du weisst. Es ist ein schlechtes Werkzeug, um aufzubauen, was du weisst. Für Erwerb und Retention sind aktiver Abruf und Produktion durchgehend überlegen.

Wie LinGoat getippten aktiven Abruf nutzt

LinGoat baut auf dem Prinzip auf, dass Produktion das Lernen antreibt. Statt dir vier Optionen zu zeigen und dich auswählen zu lassen, gibt dir LinGoat einen Prompt und ein leeres Textfeld. Du tippst deine Antwort als vollständigen Satz in deiner Zielsprache. Es gibt keine Optionen zur Auswahl, keine Lures, die dein Gedächtnis kontaminieren, und keine Abkürzung am vollständigen Abruf vorbei.

Jedes Wort und jedes Grammatikkonzept in deiner getippten Antwort wird einzeln bewertet, und die Items, die du falsch hattest, fliessen in einen FSRS-basierten Spaced-Repetition-Plan, damit sie zur richtigen Zeit wiederkehren. Das kombiniert den Produktionseffekt (Tippen erzwingt Aufmerksamkeit auf die Form), den Testeffekt (Abruf aus dem Gedächtnis ohne Hinweise) und wünschenswerte Schwierigkeit (einen ganzen Satz zu generieren ist schwerer als eine Option anzuklicken, und genau diese Schwierigkeit macht es effektiv).

Schau dir an, wie LinGoat funktioniert, oder probiere die App aus, um getippten aktiven Abruf in der Praxis zu erleben.

Referenzen

Roediger, H. L., & Marsh, E. J. (2005). The positive and negative consequences of multiple-choice testing. Journal of Experimental Psychology: Learning, Memory, and Cognition, 31(5), 1155-1159. https://doi.org/10.1037/0278-7393.31.5.1155
Karpicke, J. D., & Roediger, H. L. (2008). The critical importance of retrieval for learning. Science, 319(5865), 966-968. https://doi.org/10.1126/science.1152408
Bjork, R. A., & Bjork, E. L. (2020). Desirable difficulties in theory and practice. Journal of Applied Research in Memory and Cognition, 9(4), 475-479. https://doi.org/10.1016/j.jarmac.2020.09.003
Butler, A. C., & Roediger, H. L. (2008). Feedback enhances the positive effects and reduces the negative effects of multiple-choice testing. Memory & Cognition, 36(3), 604-616. https://doi.org/10.3758/MC.36.3.604
Carrier, M., & Pashler, H. (1992). The influence of retrieval on retention. Memory & Cognition, 20(6), 633-642. https://doi.org/10.3758/BF03197242
MacLeod, C. M., Gopie, N., Hourihan, K. L., Neary, K. R., & Ozubko, J. D. (2010). The production effect: Delineation of a phenomenon. Journal of Experimental Psychology: Learning, Memory, and Cognition, 36(3), 671-685. https://doi.org/10.1037/a0018785
Little, J. L., Bjork, E. L., Bjork, R. A., & Angello, G. (2012). Multiple-choice tests exonerated, at least of some charges: Fostering test-induced learning and avoiding test-induced forgetting. Psychological Science, 23(11), 1337-1344. https://doi.org/10.1177/0956797612443370