2026-06-10

Répétition espacée par phrases : vocabulaire 4 à 6 fois plus rapide

Une étude ACL de 2024 montre que la répétition espacée par phrases permet d'apprendre le vocabulaire 4 à 6 fois plus vite qu'avec les flashcards isolés.

La réponse courte

La répétition espacée par phrases permet d'apprendre un nouveau vocabulaire environ 4 à 6 fois plus vite qu'avec les fiches classiques à mot unique, selon une étude publiée en 2024 auprès de 26 apprenants danois.¹ Le principe : combiner dynamiquement plusieurs mots à revoir dans une seule phrase naturelle, évaluer chaque mot séparément, et conserver la planification standard de la répétition espacée. Les apprenants ont rencontré 3 à 4 fois plus de mots distincts par session, avec un taux de rétention comparable, et ont signalé un plus grand plaisir d'apprendre lorsque les phrases provenaient d'un corpus de qualité plutôt que d'un modèle de langue seul.

Cette approche se situe entre deux pratiques SRS courantes : les fiches à mot isolé (souplesse maximale du planning, contexte minimal) et les fiches-phrases figées (contexte riche, mais une carte par phrase). La SRS par phrases vise les deux à la fois : les mots conservent leurs propres intervalles de révision, mais chaque révision se fait dans un contexte nouveau et adapté au niveau.

Qu'est-ce que la répétition espacée par phrases ?

Les logiciels de répétition espacée traditionnels (Anki, SuperMemo, Mnemosyne) proposent généralement l'un de ces trois formats pour le vocabulaire :¹

Approche	Ce que vous révisez	Planification	Contexte
Fiches à mot unique	Un lemme ou une paire de traduction	Indépendante par mot	Absent ou minimal
Phrase fixe + mot	Un mot cible mis en évidence dans une phrase d'exemple statique	Indépendante par mot	La même phrase à chaque fois
Fiches phrase entière	Une phrase ou un passage entier	Un intervalle par phrase	Complet, mais groupé
SRS par phrases	Une nouvelle phrase construite à partir de plusieurs mots à revoir	Indépendante par mot	Contexte renouvelé à chaque révision

Des chercheurs de l'université de Copenhague ont conçu AllAI (Automated Language Learning with AI) pour tester ce quatrième modèle. Le système suit votre vocabulaire, repère les mots à revoir et compose une courte phrase en y intégrant le plus grand nombre possible de ces mots. Après votre tentative de rappel, vous signalez les mots oubliés. La prochaine date de révision de chaque mot est mise à jour séparément, exactement comme dans un jeu de fiches ordinaire.¹

Pourquoi le contexte est essentiel pour retenir le vocabulaire

La répétition espacée est l'un des outils les mieux documentés dans l'apprentissage des langues assisté par ordinateur.² Pourtant, le vocabulaire ne vit pas en vase clos. Les mots appris dans des phrases se renforcent mutuellement, offrent des indices de sens et reflètent la langue telle qu'elle est réellement utilisée.¹

Ce paradoxe est familier à quiconque a utilisé Anki pour apprendre une langue :

Principe de l'information minimale : chaque révision doit porter sur un seul fait isolé pour que la planification reste précise.¹
Apprentissage en contexte : rappeler un mot dans une phrase est bien plus proche de la compréhension et de la production réelles que de mémoriser sa traduction isolée.

La SRS par phrases tente de concilier les deux exigences. Les mots conservent des intervalles indépendants (comme les fiches à mot unique), mais chaque exposition se fait dans une phrase variée (contrairement aux phrases d'exemple figées qui se répètent indéfiniment). C'est précisément cette combinaison que l'étude de 2024 a mesurée face à une condition de référence classique.

Comment AllAI génère les phrases

Avant de mener une étude avec de vrais apprenants, les chercheurs ont simulé 20 jours de révision et comparé plusieurs pipelines de traitement automatique du langage. Deux méthodes se sont révélées suffisamment performantes pour être testées en conditions réelles :¹

1. Extraction dans un corpus (BM25)

Le système interroge un corpus filtré dérivé de Wikipédia (Wiki-40B) avec les mots à revoir de l'apprenant. Un algorithme BM25 modifié attribue des scores aux phrases contenant le plus grand nombre de ces mots, en pondérant davantage ceux dont la révision est la plus urgente. Les phrases sont limitées à 10 mots, n'utilisent que du vocabulaire déjà connu (plus un petit nombre de mots nouveaux) et ne se répètent pas dans la même journée.¹

Des évaluateurs humains ont jugé les phrases extraites grammaticalement correctes à 100 % lors de la simulation. Cette méthode est aussi peu coûteuse à grande échelle, car elle sélectionne des phrases existantes plutôt que d'en générer de nouvelles.

2. Génération par modèle de langue (GPT-3.5)

Une autre approche soumet à GPT-3.5-turbo trois exemples en danois et lui demande de rédiger une courte phrase à partir de cinq mots à revoir. La meilleure configuration utilisait une température basse (0,2), filtrait les réponses incorrectes en relançant le modèle et sélectionnait, parmi trois générations, la candidate obtenant le meilleur score de planification.¹

Les phrases générées étaient majoritairement correctes, mais pas parfaites : environ 15 % ont été jugées incorrectes par les évaluateurs humains. Un problème plus difficile à résoudre était la boucle de lemmes : le modèle fléchissait souvent les mots différemment de la forme stockée dans le jeu de fiches, si bien que la forme à revoir n'était jamais validée et continuait d'apparaître.

3. Hybride (50 % extraction, 50 % génération)

L'approche hybride alternait extraction BM25 et génération GPT-3.5. Elle réduisait les boucles de lemmes (l'extraction brise le cycle) mais conservait certaines erreurs de génération. La méthode d'extraction pure et la méthode hybride ont toutes deux été retenues pour l'étude avec de vrais apprenants.

Méthode	Score de planification (plus bas = mieux)	Phrases de plus de 10 mots	Incorrect (évaluation humaine)
GPT-3.5 (meilleure configuration)	0,068	19,6 %	15 %
BM25 (meilleure sur 25)	0,098	8,5 %	0 %
Hybride	0,078	11,2 %	10 %

Le score de planification mesure la part du calendrier SRS gaspillée par l'affichage de mots avant leur échéance ou par l'introduction de vocabulaire non prévu. Un score inférieur à 0,1 signifie que moins d'un mot sur dix dans une tâche était désynchronisé avec le planificateur.¹

L'étude utilisateur : un apprentissage 4 à 6 fois plus rapide

Vingt-six apprenants ont étudié le danois pendant 10 jours via une application web progressive. L'application utilisait l'algorithme SM-2 (la base du planificateur classique d'Anki) avec une échelle simplifiée à deux niveaux : mémorisé ou non mémorisé.¹ Les participants étaient répartis en trois groupes :

Groupe	Ce que les apprenants voyaient	Tâches distinctes (médiane)
Référence (mot unique)	Un mot à revoir mis en évidence dans une phrase d'exemple fixe (style Anki classique)	15 mots vus
Extraction	Phrases dynamiques issues de la recherche BM25	55 mots vus
Hybride	Alternance entre phrases extraites et phrases générées par GPT-3.5	78 mots vus

Résultats en termes d'efficacité

Le résultat phare concerne l'efficacité temporelle : la progression du vocabulaire par minute d'étude. Les groupes extraction et hybride ont atteint une efficacité environ quatre fois supérieure à celle du groupe de référence. La progression globale du vocabulaire a été 4 à 6 fois plus élevée, portée principalement par l'exposition à davantage de mots par session, sans diminution du taux de rétention.¹

Indicateur	Référence (mot unique)	Extraction	Hybride
Efficacité temporelle (mots/min, médiane)	0,10	0,59	0,38
Efficacité temporelle (mots/min, moyenne)	0,14	0,60	0,54
Progression du vocabulaire (médiane)	1,5 mots	10,0 mots	6,0 mots
Efficacité par mot (taux de rétention)	0,05	0,17	0,12
Mots distincts vus (médiane)	15	55	78

L'efficacité par mot (nouveaux mots mémorisés divisés par mots vus) est restée stable, voire légèrement supérieure dans les groupes tests. Les apprenants ne sacrifiaient pas leur rétention pour aller plus vite : ils rencontraient simplement plus de vocabulaire dans le même temps d'étude, parce que chaque phrase regroupait plusieurs mots à revoir.¹

Engagement et plaisir d'apprendre

Le plaisir autodéclaré était significativement plus élevé dans le groupe extraction que dans le groupe de référence (p = 0,042) et le groupe hybride (p = 0,028). L'efficacité et le plaisir étaient positivement corrélés (r de Pearson = 0,5), ce qui suggère qu'une progression rapide rend l'étude plus gratifiante.¹

Les débutants en ont tiré le plus grand bénéfice : la progression du vocabulaire était inversement corrélée avec les connaissances préalables en danois (r = -0,4). Les phrases dynamiques semblent particulièrement utiles en début d'apprentissage, quand chaque nouveau mot a besoin d'un contexte riche et d'expositions fréquentes.

Comparaison avec la répétition espacée classique

La plupart des apprenants qui utilisent la SRS aujourd'hui appartiennent à l'un de ces deux camps :

Listes de mots sur des fiches (rapides à créer, mais les mots sont hors contexte).
Phrases d'exemple fixes (ajoutent du contexte, mais la même phrase se répète jusqu'à ce qu'elle soit mémorisée comme un bloc figé plutôt que comme du vocabulaire flexible).

Le groupe de référence dans l'étude AllAI imitait la deuxième approche : chaque mot disposait d'une unique phrase d'exemple définitivement assignée. La SRS par phrases a surpassé ce groupe sur presque tous les indicateurs d'apprentissage, tout en faisant mieux que les révisions de mots isolés sur le plan de l'engagement.¹

Ce résultat rejoint un ensemble de recherches plus larges montrant que les tâches à fort engagement et à caractère productif (comme rédiger des phrases) surpassent souvent les formats passifs pour l'apprentissage du vocabulaire.³ La SRS par phrases occupe une position intermédiaire : vous rappelez activement les mots, mais le système fournit un contexte varié, vous évitant de rédiger chaque phrase entièrement de zéro.

Conseils pratiques pour les apprenants

1. Regroupez plusieurs mots à revoir dans une même révision

Si vous utilisez Anki ou une autre application SRS manuellement, envisagez de réviser les mots dans de courtes phrases que vous rédigez vous-même, ou d'utiliser des extensions qui regroupent les cartes échues. L'étude AllAI suggère que le gain d'efficacité vient de la densité : plus de mots cibles par minute d'attention.

2. Privilégiez de vraies phrases plutôt que des exemples statiques répétitifs

Une phrase d'exemple fixe sur chaque carte vaut mieux qu'aucun contexte, mais répéter toujours la même phrase entraîne la reconnaissance d'un motif au niveau de la phrase plutôt qu'un véritable rappel au niveau du mot. Varier le contexte oblige à un rappel authentique. Dans la simulation, l'extraction à partir d'un corpus a atteint une correction grammaticale parfaite parce qu'elle puisait dans des phrases réelles et attestées.¹

3. Conservez la planification individuelle par mot

Ne sacrifiez pas les intervalles indépendants par mot au profit du contexte. Le principe de l'information minimale existe parce que regrouper trop d'éléments dans une seule carte rend le planificateur aveugle quant au mot oublié. La SRS par phrases fonctionne précisément parce que vous évaluez chaque mot séparément après une phrase commune.

4. Prudence avec les phrases générées par l'IA

Les grands modèles de langue produisent des phrases fluides, mais les erreurs de morphologie et les décalages de lemmes peuvent perturber la planification SRS dans les langues à forte flexion. En attendant que la qualité de génération et le contrôle des formes s'améliorent, l'extraction depuis un corpus organisé (ou un dictionnaire avec des exemples attestés) reste le choix le plus sûr.¹

Limites de l'étude

Ces résultats doivent être interprétés avec discernement :

Échantillon restreint : 26 participants recrutés via des réseaux sociaux, étudiant le danois pendant 10 jours.
Durée courte : la rétention à long terme au-delà de la période d'étude n'a pas été mesurée directement (bien que le plaisir d'apprendre puisse prédire la persévérance).
Une seule langue cible : la morphologie danoise peut amplifier ou atténuer les erreurs de génération par rapport à l'espagnol, à l'anglais ou au japonais.
Comparaisons multiples : avec 11 indicateurs sur trois groupes, certaines valeurs p ne résisteraient pas à une correction de Bonferroni stricte. L'écart d'efficacité entre extraction et référence est resté significatif sous ce seuil plus strict.¹

Les auteurs notent que des modèles plus récents (GPT-4 et au-delà) pourraient combler l'écart de correction avec l'extraction, mais cette hypothèse nécessite des études à plus grande échelle.

Comment obtenir ces résultats en pratique

LinGoat est la seule application d'apprentissage des langues qui met en œuvre la répétition espacée par phrases telle que cette recherche la décrit : elle combine plusieurs mots à réviser dans de nouvelles phrases d'entraînement, vous permet de noter chaque mot séparément et planifie les révisions avec FSRS. Anki et les outils similaires reposent sur des cartes à un seul mot ou des phrases d'exemple fixes. Ils n'assemblent pas automatiquement des phrases dynamiques à partir de votre vocabulaire et de votre calendrier de révision.

Si vous voulez le gain d'efficacité de 4 à 6 fois mesuré dans cette étude, utilisez LinGoat. Ouvrez l'application pour commencer, ou consultez comment ça fonctionne.