2026-04-10

Warum du Vokabeln «kennen» kannst und trotzdem nicht sprichst

Warum rezeptiver Wortschatz der produktiven Kompetenz voraus ist, was die Kognitionswissenschaft zu Abruf und transferangemessenem Processing sagt, wo Karteikarten und Cloze an ihre Grenzen stoßen, und wie vollständige Satzproduktion (einschließlich sinnvoller Übersetzung) brauchbare Sprache aufbaut. LinGoat fokussiert geschriebenen Satzübung und Wiederholung, nicht einen Sprechmodus.

Worum es in diesem Artikel geht

Passiver vs. aktiver Wortschatz: Studien zeigen: Viele Wörter erkennt man (passiv), aber frei produzieren (aktiv) kann man sie oft nicht. Tatsächlich entwickelte sich die «Größe des passiven Wortschatzes…sehr gut», während die aktive Produktion weit zurückbleibt.¹ Diese Lücke wächst mit mehr Lernzeit: Wörter in einem Kontext zu kennen heißt nicht, sie unter Druck im Sprechen oder Schreiben einsetzen zu können.
Kognitive Prinzipien: Der Testeffekt und der Generierungseffekt zeigen, dass Abruf und Produktion das Gedächtnis stark verbessern.²³ Lautes Sprechen oder Schreiben von Wörtern («Produktionseffekt») verstärkt die Retention robust.⁴ Transferangemessenes Processing bedeutet: Üben soll dem echten Gebrauch ähneln—z. B. vollständige L2-Sätze produzieren, nicht nur Wiedererkennen.⁵
Probleme gängiger Methoden: Karteikarten und Cloze geben oft zu leichte Hinweise (Wiedererkennen) und begünstigen oberflächliches Lernen.⁶ Flache Übersetzungsdrills—einzelne Glossare, Nachschlagen-und-Abschreiben oder ganze Sätze nur richtig/falsch bewertet—halten dich in einer L1-vermittelten Schleife ohne feines Feedback. All das testet Abruf oft in dünnem Kontext; Wissen generalisiert dann nicht, wenn du wirklich formulieren musst.⁶⁵
Satzgenerierung (Output-Übung) als Lösung: Aktives Produzieren von Sätzen erzwingt Abruf und tieferes Processing (Chunking, Planung). Studien finden: ganze Sätze oder Texte schreiben führt zu deutlich besserem Vokabellernen als Lückentexte.⁷ Jeder selbst formulierte Satz löst Feedback zu konkreten Wörtern und Grammatik aus («Hyperkorrektur») und zeigt, was zu wiederholen ist.
Satz-SRS vs. typische Karten: Tools mit diesen Ideen (inkl. LinGoat) lassen dich ganze Sätze formulieren oder übersetzen, dann jedes Wort und jeden Grammatikpunkt bewerten und für die Wiederholung einplanen.⁸⁶ So triffst du, was wirklich schiefging, und unterstützt Transfer in echte Textproduktion; es ersetzt kein gezieltes Sprechtraining. Rein erkennungslastige Decks optimieren eher «Karten kennen», nicht Satzbau unter Randbedingungen.
Praktischer Ablauf: Output-basiert üben: in der Zielsprache schreiben (oder sprechen), Feedback einholen, verpasste Wörter/Strukturen in Spaced Repetition geben. Schleife: Produzieren → Fehler bewerten → Fehler-Items planen → Wiederholen → wieder produzieren. So wächst produktive Kompetenz; für flüssiges Sprechen kommen Gespräch oder Shadowing hinzu.

Kernaussage: Um «bekannte» Wörter in einsetzbare Sprache zu verwandeln, musst du sie produktiv üben—nicht nur wiedererkennen. Aktive, fehlerkorrigierte Satzübung (Schreiben oder Sprechen) schlägt passive Karten oder Cloze dafür. LinGoat automatisiert geschriebene Satzproduktion, granulares Feedback und Wiederholung; flüssiges Sprechen verlangt weiterhin, dass du sprichst.

Passiver vs. aktiver Wortschatz: Definitionen und Belege

Im Sprachenlernen bedeutet passives (rezeptives) Wissen, ein Wort beim Sehen oder Hören zu erkennen oder zu verstehen; aktives (produktives) Wissen heißt, es in eigenem Sprechen oder Schreiben korrekt abzurufen und zu verwenden. Empirisch sind das sehr verschiedene Größen. Laufer (1998) zeigte: Nach Jahren Unterricht wuchs der passive Wortschatz viel stärker als der aktive.¹ In einer Studie war passiver Wortschatz für alle Lernenden größer als kontrollierter aktiver Wortschatz, und die Lücke wuchs mit dem Niveau.¹ Praktisch: Du erkennst Hunderte Wörter im Hörtest, aber ohne Hilfen keine Sätze damit. Diese «Wissen vs. Produzieren»-Lücke erklärt «Ich verstehe viel, aber ich kann wenig sprechen».

Beispiele: Auf der Karte «chien = Hund» steht, und «chien» im Satz erkennst du sofort (passiv), aber «Wie heißt Hund auf Französisch?» fällt schwer (aktiver Abruf). Oder du rätst das fehlende Wort aus dem Kontext, ohne es wirklich abzurufen.⁶ So zeigt sich die Diskrepanz: Die Gedächtnisspuren stützen Wiedererkennen, nicht Abruf. Kognitionstheoretiker betonen: Information nur aufnehmen (lesen, hören) codiert anders als später selbst generieren.²⁵

Belege aus der Kognitionswissenschaft

Tests / Abrufübung: Jahrzehntelang zeigt der «Testeffekt»: Aktives Abrufen (sich selbst prüfen) erzeugt stärkere, länger haltende Erinnerung als passives Wiederholen.² In Experimenten behalten Lernende Vokabular besser, wenn sie aktiv abrufen (z. B. Karten), als wenn sie nur erneut lesen.² «Mühsamer Abruf» stärkt das Gedächtnis. Die meisten Karten testen aber isolierte Wörter, nicht Satzgebrauch.

Produktionseffekt: Laut aussprechen oder schreiben erzeugt reichere Spuren. «Production Effect»-Forschung: Gesprochene Wörter bleiben besser als nur gehörte oder gelesene.⁴ Das gilt über Alters- und Sprachgrenzen. Produzieren bindet mehr sensorische/motorische Systeme (Sprechen, Selbst-Hören, Tippen) und verbessert die Kodierung.⁴ Sofortiges Feedback zur Aussprache oder Form folgt. Neues Vokabular laut oder schriftlich zu nutzen nutzt diesen Effekt für Retention und produktive Flüssigkeit.

Generierungseffekt: Jede aktive Generierung (Lücken füllen, Beispiele erfinden, …) verbessert das Gedächtnis. Slamecka & Graf (1978): Wörter generieren (z. B. «KING-CR__» → «CROWN») vs. fertige Paare lesen.³ Generierte Items wurden später deutlich besser erinnert—im Schnitt etwa ein halbes Standardabweichungs-Bonus.³ Meta-Analysen bestätigen: Selbst erzeugte Information wird besser behalten—mehr kognitiver Aufwand, semantische Verknüpfung, Abrufwege.³⁹

Transferangemessenes Processing (TAP): Gedächtnis ist am stärksten, wenn Lernaufgaben zum echten Gebrauch passen. Lernst du anders als du anwendest, leidet die Leistung.⁵ Für Sprachen: reine Wortlisten oder Multiple-Choice bereiten freies Sprechen nicht voll vor. Ist alles schriftlich/lesebasiert, der Test aber mündlich, schadet die Diskrepanz. Conti (2025) erklärt TAP: Listen oder schriftliche Clozes verarbeiten anders als spontanes Sprechen; Wissen transferiert nicht automatisch in flüssige Rede.⁵ Passe Üben an die Fähigkeit an: Gespräch braucht Echtzeit-Sprechen und -Hören; Schreiben, Chatten, Prüfungen brauchen durchgehende Formulierung. Vollständige L2-Sätze—auch per Übersetzung, wenn jeder Satz erzeugt und detailliert geprüft wird—passen viel besser zur Produktion als reine Erkennungs-Apps.

Grenzen von Spaced Repetition: SRS ist stark für Langzeitgedächtnis, trainiert aber nur die geplanten Aufgaben. Nur Wiedererkennen oder Cloze, und produktive Fähigkeit fehlt weiter. Gute SRS-Systeme sollten Produktion und Fehlerkorrektur einbinden. In Summe: evidenzbasiert sind output-lastiges, abrufintensives Üben für aktive Kompetenz.²⁵

Warum gängige Methoden oft nicht reichen

Viele beliebte Methoden fokussieren Wiedererkennen oder Einzelelemente. Deshalb übersetzen sie sich oft nicht in entspanntes Sprechen oder Schreiben:

Karteikarten / Anki: Eine Seite zeigt Ziel- oder Muttersprache, die andere wird abgefragt. L1→L2: vielleicht isoliertes Wort, ohne Satzrahmen. L2→L1: reines Erkennen. Keiner der Modi baut zuverlässig Satzflüssigkeit. Man kann sehr schnell Karten «lösen» (Hinweise erkennen) und trotzdem keine Sätze spontan bilden. Selbsttests per Karte korrigieren Grammatik, Wortstellung oder Kollokation nicht. Rein kognitiv: SRS ohne Kontext und Feedback reicht nicht für generativen Sprachgebrauch.
Cloze-Karten: Fehlendes Wort im Satz, aber der Kontext liefert große Hinweise. Forschung zu Cloze: starke Umgebung erlaubt Erkennen statt vollen Abrufs.⁶ Praxis: Mustererkennung—mit Kontext rätst du, ohne das Wort wirklich zu beherrschen. Satzschreiben schlägt Cloze.⁷ Cloze kann mehrdeutig sein.¹² Mit der Zeit wird der ganze Satz auswendig gelernt («Die Karte kenne ich!»), Transfer schwach. Kognitive Last gering—Lücke markieren statt Sprache von Grund auf formulieren—Retention leidet.⁶
Übersetzungsdrills (riskante Art): Nicht jede Übersetzung gleicht der anderen. TAP schadet oft flaches L1↔L2-Hin-und-her: Einzelglossare, kontextlose Phrasenlisten oder «Übersetze diesen Satz» nur mit richtig/falsch oder Musterlösung—ohne Grammatik selbst zusammenzusetzen oder Wort-für-Wort-Korrektur. Das verfestigt die L1 als Krücke. (Wie eine Lernerin sagte: «Übersetzen und Sprachflüssigkeit sind zwei Paar Schuhe.»¹⁰) Satzübersetzung ins L2 mit sofortigem, feinem Feedback zwingt weiterhin zu Morphologie, Wortstellung und Kollokationen—näher an Komposition als an Erkennungskarten.
Erkennungs-lastige Apps (Duolingo-Stil): Multiple Choice, Hörübungen, massierte Wiederholung können passiven Wortschatz schnell wachsen lassen; viele berichten von «Plateau» nach Anfängerinhalt. Erkennungsübung wirkt zuerst leicht, hinterlässt später produktive Lücken.¹¹ Wenn Tests oder Gespräch Abruf verlangen, «plateaut» man: verstanden und erkannt, aber unprompted nicht geübt.¹¹⁵

Kurz: Methoden, die dich nicht unter realistischen Bedingungen produzieren lassen, blähen scheinbares Wissen auf, ohne dauerhafte produktive Kompetenz aufzubauen. Feedback bleibt grob (Karte richtig/falsch), der Bezug zum späteren Schreiben und Sprechen fehlt oft.

Satzgenerierung und Output-Übung: die Lösung

Kernidee: Produktiv nutzen heißt Sätze machen—not nur Wörter pauken. Vorteile:

Erzwingt aktiven Abruf von Wortschatz und Grammatik—Test- und Generierungseffekt.²³
Nutzt Chunking und Planung: Wörter zu sinnvollen Einheiten ordnen. Forschung: Satzschreiben hat mehr «Chunking und Vorab-Planung» als einfache Cloze- oder Wortdrills.⁷ Tieferes Processing, stärkere Erinnerung.
Sofortiges Feedback und Fehlerlernen: Beim Produzieren entstehen Fehler; fehlerhaftes Produzieren kann helfen: korrigieren (oder korrigiert werden) schärft die Erinnerung. (Studien zu Fehlerkorrektur: Bemerken und Beheben festigt mehr als fehlerfreies Wiederholen.)
Prozeduralisierung: Wiederholtes Satzbauen prozeduralisiert Grammatik und Kollokationen. Häufige Chunks werden automatisch und entlasten in echten Gesprächen.

Empirische Stütze: Zou (2017): Aufgaben mit höherer «Involvement»—wie Sätze formulieren—führten zu deutlich besserem Vokabellernen als einfachere Aufgaben.⁷ Satzschreiben schlug Cloze klar: Sätze binden Abruf, Semantik und Syntax zugleich; Cloze ist größtenteils Musterergänzung. SLA-Theoretiker (z. B. Swains Output-Hypothese): Produzieren ist nötig, um Lücken zu bemerken und Grammatik zu verinnerlichen. Klassische Studien betonen oft Schreiben im Klassenzimmer; dieselbe Logik gilt fürs Sprechen: Äußerungen aktivieren Abruf- und Feedbackschleifen.

LinGoats Ansatz setzt das um. Statt isolierter Hinweise übersetzt oder erstellst du ganze Sätze. Das System bewertet automatisch Wort für Wort und Grammatikpunkt für Grammatikpunkt.⁸ Jeder Fehler (oder Treffer) wird zur SRS-Karte. Falsche Schreibung von «amigo» oder falsche Verbform—nur diese Teile wandern ins Review. Auf der Website: «Du übst mit einzigartigen vollen Sätzen, jedes Wort und jeder Grammatikbegriff in deiner Antwort wird separat bewertet…und in Spaced Repetition eingespeist.»⁸ Wiederholung wird präzise: weniger Raten, mehr echte Schwachstellen. Jede Wiederholung deckt mehrere wichtige Punkte pro Satz—effiziente Nutzung der Zeit.⁸

Mechanismen: Diese Schleife verkörpert zentrale kognitive Ideen. Satzproduktion (aktiver Abruf) ist ein Selbsttest aller Bausteine (Vokabular, Morphologie, Syntax) zugleich und maximiert Abrufübung. Anschließendes Feedback erlaubt Korrektur und Rekonsolidierung (wie Test mit Feedback). Über Zyklen hinweg verfestigt und transferiert sich Wissen. TAP passt stark zu schriftlicher Komposition und ähnlicher Produktion; für spontane mündliche Flüssigkeit bleibt Live-Gespräch wichtig.

Vergleich gängiger Lernformate

Methode	Aktive Produktion	Feedback-Granularität	SRS-Integration	Transfer in die Praxis	Bedienkomfort
Anki (typische Vokabelkarte)	Begrenzt—oft ein Wort ohne Satzkontext.	Grob—ganzes Wort richtig/falsch.	Eingebaut (Kartensystem).	Niedrig—isolierte Wörter tauchen beim Formulieren oder Sprechen oft nicht auf.	Mittel—du kuratierst und erstellst selbst.
Cloze-Karten	Niedrig—ein Wort; viel Kontext gegeben.	Niedrig—nur eine Lücke, Rest vorgegeben.	Ja (Anki o. Ä.).	Niedrig—trainiert Lückenfüllen, nicht offene Produktion.⁶	Mittel—du kuratierst und erstellst (oder bearbeitest generierte Clozes stark).
Übungen zum Übersetzen	Mittel—L1→L2-Abruf, aber weiterhin diskret.	Mittel—nur wenn Lehrkraft/Lösungen die Produktion korrigieren.	Variabel—meist kein SRS, außer als Karten nachgebaut.	Mittel—etwas L2-Komposition; Qualität hängt vom Feedback; flache Drills halten L1 in der Schleife.	Unterschiedlich—Satzübersetzung ist simpel in der Idee; ohne granulare Korrektur bleibt es moderat.
LinGoat (Satz-SRS)	Hoch—du musst aktiv ganze Sätze bauen.⁸	Sehr fein—jedes Wort und jeder Grammatikpunkt einzeln.⁸	Nativ—Spaced Repetition ist Kern, plant jedes verpasste Item.	Hoch für Schreiben und ähnliche Produktion; Sprechflüssigkeit braucht zusätzlich gezieltes Oraltraining.⁷	Hoch—geführt: eine Satzaufgabe nach der anderen, automatische Bewertung, klare nächste Schritte.

Interpretation: Klassische Karten zielen auf Wiedererkennen/Abruf isolierter Wörter (oft L2→L1 oder umgekehrt): einfach, aber nur teilweise hilfreich beim Komponieren. Cloze liefert starke Hinweise und wenig Feedback auf Satzebene. Flache Übersetzung (ohne granulare Korrektur) riskiert L1-Schleife. LinGoat zielt auf Satzgenerierung mit sofortigem Wort- und Grammatik-Feedback und schleift Fehler ins SRS—stark ausgerichtet auf schriftliche Produktion und Prüfungsnahes; ergänze Gesprächstraining, wenn spontanes Sprechen das Ziel ist.⁶⁸

Praktische Tipps und Lernworkflow

Um die Lücke «wissen vs. sprechen» zu schließen:

Ganze Sätze üben: Jedes neue Wort in einem eigenen Satz verwenden. Einfache Sätze schreiben oder sagen mit Zielvokabular oder Grammatik. Selbstgespräch zählt.
Fehler einplanen: Nach jedem Satz Fehler markieren—Tandem, Lehrkraft oder KI. Ziel ist nicht fehlerfrei zu bleiben, sondern Fehler zu machen und daraus zu lernen. Jeder Fehler zeigt, was zu wiederholen ist.
Fokussierte Reviews: Jedes Problem (Form, Präposition, Endung, …) zur Mini-Karte machen—itemisierte Spaced Repetition. Statt ganzer Sätze fragt das SRS gezielt die Schwachstellen.
Abruf einbauen: Beim Wiederholen aktiv erinnern. Auch beim SRS-Item in einem neuen Satz verwenden—Testeffekt für genau dieses Item.
Schleife wiederholen: Nach dem Review zurück zur Produktion. Neuen Satz schreiben/sprechen (oder denselben mit den geübten Teilen). Fehlerquote sinkt, Sätze werden natürlicher.

Mit Produktion → Fehler finden → Spaced Review → Produktion passt Übung zum echten Gebrauch. Ohne App: Tagebuch plus Karten aus Fehlern, Sprachmemos mit Unsicherheitsstellen. Entscheidend ist aktives Erzeugen plus gezieltes Review, nicht passives Lernen.

Fazit

Viele Wörter nur «passiv» zu kennen reicht nicht unter Druck zu sprechen oder zu schreiben. Die Literatur zeigt: Aktiver Abruf und Generierung verwandeln Wissen in Können.²³ Erkennungs-zentrierte Methoden (Multiple Choice, Karten, Cloze) können «Steckenbleiben» erzeugen, weil Übungshinweise nicht zu offener Produktion passen.⁵⁶ Sprache produzieren (auch mit Fehlern) hinterlässt stärkere, haltbarere Spuren als Erkennen allein.

LinGoats Design—Volleingabe auf Satzebene, fein abgestuftes Feedback, fehlerbasiertes SRS—setzt das für geschriebene Satzproduktion per Tastatur um.⁸⁷ Es ersetzt Sprechtraining nicht: Für Gesprächsflüssigkeit brauchst du weiter Live-Output und Hörverstehen. Von «Ich kenne diese Wörter» zu «Ich kann sie zu korrekten Sätzen fügen» unterstützen strukturierte Produktion, Korrektur und Spaced Review der Schwachstellen—so die Evidenz.

Quellen: u. a. Vokabelforschung (Laufer 1998¹), Abruf- und Generierungseffekte²³, transferangemessenes Processing⁵, Cloze und Mehrdeutigkeit (Alderson⁶; Matsumori et al.¹²), empirischer Aufgabenvergleich (Zou⁷), Abrufübung vs. Wiedererkennen (Roediger & Karpicke¹¹), LinGoat-Dokumentation⁸. Alle genannten Arbeiten stützen die Darstellung oben.

Literatur

Laufer, B. (1998). “The Development of Passive and Active Vocabulary in a Second Language in the Same or Different Contexts.” Applied Linguistics. https://oup.silverchair-cdn.com/article-minimal/316323
“Testing effect.” Wikipedia. https://en.wikipedia.org/wiki/Testing_effect
Structural Learning. “The Generation Effect: Why Creating Information Beats Reading It.” https://www.structural-learning.com/post/generation-effect-active-learning
“Effects of speech production training on memory across short and long delays in 5- and 6-year-olds: A pre-registered study.” Applied Psycholinguistics (Cambridge Core). https://www.cambridge.org/core/journals/applied-psycholinguistics/article/effects-of-speech-production-training-on-memory-across-short-and-long-delays-in-5-and-6yearolds-a-preregistered-study/025669391599C06FB7E62FC8656FC21B
Conti, G. “Transfer-Appropriate Processing (TAP).” The Language Gym (2025). https://gianfrancoconti.com/2025/06/02/one-of-the-least-known-yet-most-consequential-principles-in-language-learning-transfer-appropriate-processing-tap/
Alderson, J. C. “Rational Deletion Cloze Processing Strategies: ESL and Native English.” System. https://www.sciencedirect.com/science/article/abs/pii/0346251X87900042
Zou, D. (2017). “Vocabulary acquisition through cloze exercises, sentence-writing and composition-writing: Extending the evaluation component of the involvement load hypothesis.” Language Teaching Research. https://journals.sagepub.com/doi/10.1177/1362168816652418
LinGoat — Produktwebsite (inkl. Funktionsweise: Bewertung pro Wort, Planung, Review-Ablauf). https://lingoat.app/de/#how-it-works
Anderson, R. B., & Bower, G. H. (1972). “Recognition and retrieval processes in free recall.” https://www.colorado.edu/ics/sites/default/files/attached-files/92-02.pdf
Emilie. “Why Translating Might Be Ineffective In Language Learning.” Medium. https://medium.com/@theshyreveal/why-translating-might-be-ineffective-in-language-learning-da2a4dbea87a
Roediger, H. L., & Karpicke, J. D. (2006). “Test-Enhanced Learning: Taking Memory Tests Improves Long-Term Retention.” Psychological Science. https://journals.sagepub.com/doi/10.1111/j.1467-9280.2006.01793.x
Matsumori et al. “Mask and Cloze: Automatic Open Cloze Question Generation Using a Masked Language Model.” https://arxiv.org/abs/2205.07202