Más allá del token: por qué los LLM necesitan lingüistas e informáticos para hablar español

Ponentes: Marina Mayor Rocher (Universidad Autónoma de Madrid) y Gonzalo Martínez (Universidad Politécnica de Madrid).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 20 de marzo de 2026, 11:00.

Resumen:  Este seminario propone un diálogo metodológico entre lingüística e informática para abordar qué significa evaluar un Large Language Model (LLM) como “hablante” de español. Más allá de métricas generales de rendimiento, se plantea una colaboración en la que cada disciplina aporta sus herramientas analíticas, integradas en diseños experimentales formalizados, implementables computacionalmente y reproducibles. El objetivo no es solo determinar si los modelos generan secuencias plausibles, sino analizar si en su producción emergen regularidades comparables a las de la gramática de los hablantes. En primer lugar, se abordará la construcción de pruebas de competencia lingüística, como TELEIA, un test inspirado en exámenes de español para extranjeros que permite evaluar el conocimiento gramatical y la comprensión lectora de los modelos. En segundo lugar, se discutirá la posibilidad de evaluar la variación dialectal mediante experimentos sobre reconocimiento de variedades del español, analizando diferencias morfosintácticas y léxicas y su relación con el Sesgo Lingüístico Digital. Finalmente, se mostrará cómo diseñar tareas controladas sobre fenómenos gramaticales en proceso de cambio, como las formas de futuro o el Marcado Diferencial de Objeto, para determinar hasta qué punto los modelos reproducen los patrones de variación documentados en la gramática del español y si su comportamiento converge con el de los hablantes ante los mismos estímulos experimentales.

La teoría de grafos en la lingüística aplicada: el caso del lexicón mental

Ponente: María del Pilar Agustín Llach (Grupo de Lingüística Aplicada de la Universidad de La Rioja, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: miércoles 15 de mayo de 2024, 11:00.

Resumen: El estudio de las asociaciones léxico semánticas ha ocupado a los investigadores desde antiguo. A través de tareas de asociaciones y de fluidez verbal se pretende examinar tanto la compleja estructura de dicho lexicón mental y las normas y mecanismos que lo rigen como las estrategias de acceso y de fijación de los elementos léxicos. Igualmente, se pretende explorar la organización mental del léxico de diferentes tipos de hablantes y aprendices de lenguas.

En este sentido, la Lingüística Aplicada usa la metáfora de la red, comparando la representación o almacenamiento de las palabras en la mente con una red. Así, las matemáticas, a través de la teoría de grafos, permiten una aproximación teórica y metodológica a esta red semántica.

En esta charla vamos a ver una serie de conceptos clave, métodos y métricas, que resultan de utilidad en los estudios de redes semánticas con grafos tales como nodo, arista, grado, coeficiente de clústering, o modularidad, entre otros. Finalmente, vamos a examinar los resultados de algunos estudios experimentales con grafos y redes semánticas en L1 y L2 para ver qué métricas han resultado más útiles, qué teorías ayudan a explicar un acceso y navegación óptimos del lexicón mental, y cómo se pueden interpretar en términos lingüísticos respecto del aprendizaje y uso del vocabulario.