2026-06-10

Repetición Espaciada con Frases: Vocabulario 4-6 Veces Más Rápido

Un estudio de 2024 confirma que la repetición espaciada basada en frases permite aprender vocabulario 4-6 veces más rápido que las tarjetas de palabras sueltas.

La respuesta corta

Según un estudio de 2024 con 26 aprendices de danés, la repetición espaciada basada en frases puede aprender vocabulario nuevo entre 4 y 6 veces más rápido que las tarjetas de palabras aisladas.¹ El principio clave: combinar dinámicamente varias palabras pendientes en una sola frase natural, calificar cada palabra de forma independiente y mantener la programación estándar de repetición espaciada. Los participantes vieron entre 3 y 4 veces más palabras distintas por sesión, retuvieron una proporción similar de lo estudiado y reportaron mayor satisfacción cuando las frases provenían de un corpus de alta calidad en lugar de generarse exclusivamente con un modelo de lenguaje.

Este enfoque se sitúa entre dos hábitos habituales de SRS: las tarjetas de palabras aisladas (máxima flexibilidad de programación, contexto mínimo) y las tarjetas de frases fijas (contexto rico, pero una tarjeta por frase). El SRS basado en frases busca las dos ventajas a la vez: las palabras se programan con sus propios intervalos, pero cada repaso ocurre dentro de un contexto fresco y adecuado al nivel del aprendiz.

¿Qué es la repetición espaciada basada en frases?

El software tradicional de repetición espaciada (Anki, SuperMemo, Mnemosyne) suele presentar el vocabulario en uno de tres formatos:¹

Enfoque	Qué repasas	Programación	Contexto
Tarjetas de palabra sola	Un lema o par de traducción	Independiente por palabra	Ninguno o mínimo
Frase fija + palabra	Una palabra objetivo destacada en una frase de ejemplo estática	Independiente por palabra	La misma frase siempre
Tarjetas de frase completa	Una frase o párrafo entero	Un intervalo por frase	Completo, pero agrupado
SRS basado en frases	Una frase nueva construida con varias palabras pendientes	Independiente por palabra	Contexto fresco en cada repaso

Los investigadores de la Universidad de Copenhague desarrollaron AllAI (Automated Language Learning with AI) para probar este cuarto modelo. El sistema registra tu vocabulario, identifica las palabras pendientes de repaso y construye una frase corta que incluye el mayor número posible de esas palabras. Tras intentar recordar, marcas las palabras que no recordaste. La fecha del próximo repaso de cada palabra se actualiza de forma independiente, igual que en un mazo normal de tarjetas.¹

Por qué el contexto importa para retener vocabulario

La repetición espaciada es una de las herramientas con mayor respaldo empírico en el aprendizaje de lenguas asistido por ordenador.² Sin embargo, el vocabulario rara vez existe de forma aislada. Las palabras aprendidas dentro de frases se refuerzan mutuamente, ofrecen pistas inferenciales y reflejan cómo se usa realmente el idioma.¹

La tensión es familiar para cualquiera que haya usado Anki para idiomas:

Principio de información mínima: Cada tarea de repaso debe evaluar un solo dato atómico para que la programación sea precisa.¹
Aprendizaje contextual: Recordar una palabra dentro de una frase se aproxima mucho más a la comprensión y producción reales que mirar una traducción aislada.

El SRS basado en frases intenta respetar ambos principios. Sigues programando las palabras de forma independiente (como en las tarjetas de palabras aisladas), pero cada exposición ocurre en una frase variada (a diferencia de las frases de ejemplo fijas que se repiten indefinidamente). Esa combinación es precisamente lo que el estudio de 2024 comparó con la línea base convencional.

Cómo AllAI genera frases

Antes de realizar el estudio con usuarios reales, los investigadores simularon 20 días de estudio y compararon varios sistemas de procesamiento de lenguaje natural. Dos métodos obtuvieron resultados suficientemente buenos para probarse con aprendices reales:¹

1. Recuperación de corpus (BM25)

El sistema consulta un corpus filtrado derivado de Wikipedia (Wiki-40B) con las palabras pendientes del aprendiz. Un ranking BM25 modificado puntúa las frases que contienen más palabras de búsqueda, dando mayor peso a las que vencen antes. Las frases se limitan a 10 palabras, usan únicamente vocabulario que el aprendiz ya conoce (más un pequeño número de palabras nuevas) y evitan repetir la misma frase el mismo día.¹

Los evaluadores humanos calificaron las frases recuperadas como 100% gramaticalmente correctas en la simulación. Además, este método es económico a gran escala porque selecciona texto existente en lugar de generarlo.

2. Prompting few-shot con modelo de lenguaje (GPT-3.5)

Una alternativa utiliza GPT-3.5-turbo con tres ejemplos en danés y le pide que escriba una frase corta usando cinco palabras pendientes. La mejor configuración empleó temperatura baja (0,2), filtró respuestas incorrectas volviendo a consultar al modelo, y seleccionó el candidato con mejor puntuación de programación entre tres generaciones.¹

Las frases generadas eran en su mayoría correctas, pero no perfectas: aproximadamente el 15% fue calificado como incorrecto por los evaluadores humanos. Un problema más grave fue el bucle de lemas: el modelo solía flexionar las palabras de forma distinta a la almacenada en el mazo, por lo que la forma "pendiente" nunca se marcaba como aprendida y seguía reapareciendo.

3. Híbrido (50% recuperación, 50% generación)

El enfoque híbrido alternó entre recuperación BM25 y generación con GPT-3.5. Redujo el bucle de lemas (la recuperación rompe el ciclo), pero aún introducía algunos errores de generación. Tanto el método de recuperación pura como el híbrido pasaron al estudio con usuarios.

Método	Puntuación de programación (menor es mejor)	Frases de más de 10 palabras	Incorrectas (valoración humana)
GPT-3.5 (mejor configuración)	0.068	19.6%	15%
BM25 (mejor de 25)	0.098	8.5%	0%
Híbrido	0.078	11.2%	10%

La puntuación de programación mide cuánto se desperdicia del cronograma de repetición espaciada al mostrar palabras antes de que venzan o introducir vocabulario no solicitado. Una puntuación inferior a 0,1 significa que menos de una de cada diez palabras en una tarea estaba desincronizada con el programador.¹

El estudio con usuarios: vocabulario 4-6 veces más rápido

Veintiséis participantes estudiaron danés durante 10 días usando una aplicación web progresiva. La app empleó el algoritmo SM-2 (la base del programador clásico de Anki) con una escala simplificada de dos niveles: recordado o no recordado.¹ Los participantes se dividieron en tres grupos:

Grupo	Qué veían los participantes	Tareas distintas (mediana)
Línea base (palabra sola)	Una palabra pendiente destacada en una frase de ejemplo fija (estilo Anki estándar)	15 palabras vistas
Recuperación	Frases dinámicas mediante búsqueda de corpus BM25	55 palabras vistas
Híbrido	Frases alternantes de recuperación y GPT-3.5	78 palabras vistas

Resultados de eficiencia de aprendizaje

El hallazgo principal es la eficiencia temporal: el crecimiento de vocabulario por minuto de estudio. Los grupos de recuperación e híbrido lograron una eficiencia aproximadamente cuatro veces mayor que la línea base de palabras aisladas. El crecimiento de vocabulario total fue 4 a 6 veces mayor, impulsado principalmente por ver más palabras por sesión sin que cayera la proporción recordada.¹

Métrica	Línea base (palabra sola)	Recuperación	Híbrido
Eficiencia temporal (palabras/min, mediana)	0.10	0.59	0.38
Eficiencia temporal (palabras/min, media)	0.14	0.60	0.54
Crecimiento de vocabulario (mediana)	1.5 palabras	10.0 palabras	6.0 palabras
Efectividad por palabra (tasa de retención)	0.05	0.17	0.12
Palabras distintas vistas (mediana)	15	55	78

La efectividad por palabra (palabras nuevas recordadas dividido entre palabras vistas) se mantuvo similar o mejoró ligeramente en los grupos de intervención. Los participantes no sacrificaban retención para avanzar más rápido: simplemente encontraban más vocabulario en el mismo tiempo de estudio porque cada frase agrupaba varias palabras pendientes.¹

Compromiso y satisfacción

La satisfacción reportada fue significativamente mayor en el grupo de recuperación que en la línea base (p = 0,042) y en el híbrido (p = 0,028). La eficiencia y la satisfacción correlacionaron positivamente (r de Pearson = 0,5), lo que sugiere que progresar más rápido hace que estudiar resulte más gratificante.¹

Los principiantes se beneficiaron más: el crecimiento de vocabulario correlacionó negativamente con el conocimiento previo de danés (r = -0,4). Las frases dinámicas parecen especialmente útiles al inicio, cuando cada palabra nueva necesita contexto rico y exposición frecuente.

Cómo se compara con la repetición espaciada convencional

La mayoría de quienes aprenden idiomas con SRS hoy en día se divide en dos grupos:

Listas de palabras en tarjetas (rápidas de crear, pero las palabras quedan fuera de contexto).
Frases de ejemplo fijas (añaden contexto, pero la misma frase se repite hasta memorizarse como bloque en lugar de como vocabulario flexible).

La línea base del estudio AllAI imitó el segundo enfoque: cada palabra tenía una frase de ejemplo asignada de forma permanente. El SRS basado en frases superó esa línea base en casi todas las métricas de aprendizaje y también superó al repaso de palabras aisladas en satisfacción.¹

Esto coincide con investigaciones más amplias que muestran que las tareas más productivas e implicativas (como escribir frases) suelen superar a los formatos pasivos de rellenar huecos para el aprendizaje de vocabulario.³ El SRS basado en frases ocupa un punto intermedio: sigues recordando activamente, pero el sistema proporciona contexto variado para que no tengas que escribir desde cero en cada repaso.

Conclusiones prácticas para aprendices de idiomas

1. Agrupa varias palabras pendientes en un solo repaso cuando sea posible

Si usas Anki u otra aplicación SRS de forma manual, considera repasar palabras en frases cortas que escribas tú mismo, o usa complementos que agrupen las tarjetas pendientes. El estudio AllAI sugiere que la ganancia de eficiencia proviene de la densidad: más palabras objetivo por minuto de atención.

2. Prefiere frases reales a ejemplos estáticos repetidos

Una frase de ejemplo fija en cada tarjeta es mejor que ningún contexto, pero repetir siempre la misma frase entrena el reconocimiento de patrones a nivel de frase en lugar del recuerdo real de la palabra. Variar el contexto obliga al recuerdo genuino a nivel de palabra. La recuperación de corpus logró una corrección gramatical perfecta en la simulación porque usó frases reales y documentadas.¹

3. Mantén la programación independiente por palabra

No sacrifiques los intervalos independientes por palabra en aras del contexto. El principio de información mínima existe porque agrupar demasiado en una sola tarjeta deja al programador sin capacidad de saber qué parte olvidaste. El SRS basado en frases funciona porque calificas cada palabra por separado después de una frase compartida.

4. Sé prudente con las frases de estudio generadas por IA

Los modelos de lenguaje de gran tamaño pueden producir frases fluidas, pero los errores morfológicos y las incompatibilidades de lemas pueden romper la programación SRS en idiomas muy flexivos. Hasta que mejoren la calidad de generación y el control de formas, recuperar de un corpus curado (o un diccionario con ejemplos documentados) puede ser la opción más segura.¹

Limitaciones del estudio

El contexto importa al interpretar estos resultados:

Muestra pequeña: 26 participantes reclutados a través de redes sociales, estudiando danés durante 10 días.
Corta duración: No se midió directamente la retención a largo plazo más allá del período del estudio (aunque la satisfacción puede predecir el uso continuado).
Un solo idioma objetivo: La morfología del danés puede amplificar o reducir los errores de generación en comparación con el español, el inglés o el japonés.
Comparaciones múltiples: Con 11 métricas en tres grupos, algunos valores de p no sobrevivirían a una corrección estricta de Bonferroni. La diferencia de eficiencia entre recuperación y línea base se mantuvo significativa bajo ese umbral más estricto.¹

Los autores señalan que los modelos más recientes (GPT-4 y posteriores) podrían reducir la brecha de corrección con respecto a la recuperación, pero esa hipótesis necesita ensayos más amplios.

Cómo conseguir estos resultados en la práctica

LinGoat es la única aplicación de aprendizaje de idiomas que implementa la repetición espaciada basada en frases tal como la describe esta investigación: combina varias palabras pendientes de repaso en frases de práctica nuevas, te permite calificar cada palabra por separado y programa las revisiones con FSRS. Anki y herramientas similares dependen de tarjetas de una sola palabra o de frases de ejemplo fijas. No ensamblan automáticamente frases dinámicas a partir de tu vocabulario y tu calendario de repaso.

Si quieres la ganancia de eficiencia de 4 a 6 veces que midió este estudio, usa LinGoat. Abre la aplicación para empezar, o consulta cómo funciona.