¿Se debe automatizar la concesión de ayudas sociales? Un estudio sobre el caso del bono social eléctrico y el software BOSCO

Ponente: Ángel Luis Rubio García (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 29 de mayo de 2026, 12:00.

Resumen: En esta charla presentamos las conclusiones preliminares de un estudio en el que investigamos sobre la conveniencia, o más bien la necesidad, de que los resultados de los desarrollos informáticos sean explicables y trazables. Esto es especialmente importante cuando estos programas se utilizan para automatizar decisiones administrativas, como por ejemplo en la concesión del bono social eléctrico, a través del programa BOSCO. La fase central de este estudio, inspirado por el Ethical Impact Assessment de la UNESCO y el método Principle-at-Risk Analysis (PaRA), ha consistido en la realización de cerca de 25 entrevistas a personas con distintas relaciones con el bono social y el programa BOSCO (especialistas en derecho, ética e informática; profesionales de servicios sociales o consumo; personal de entidades vinculadas; personas solicitantes del bono).

Nota: Se trata de una prueba de la presentación que se realizará en el IV Seminario Iberoamericano de Ética Tecnológica, 4SIETEC, a celebrar en Granada del 10 al 12 de junio de 2026

Redes complejas en español L1 e inglés LE: de la distancia euclídea a la distancia espectral

Ponente: María del Pilar Agustín Llach (Grupo de Lingüística Aplicada de la Universidad de La Rioja, Universidad de La Rioja) y Julio Rubio García (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 22 de mayo de 2026, 11:00.

Resumen: A partir de datos adquiridos experimentalmente de aprendices de inglés se pueden construir grafos que permiten analizar cómo se organiza el lexicón mental. Aparte de estudiar cada grafo aisladamente, es posible comparar las características de distintos grafos para intentar dilucidar las interacciones entre las distintas lenguas (el español como lengua materna y el inglés como segunda lengua) y diferentes categorías semánticas.

En este trabajo, se presentan algunas conclusiones lingüísticas preliminares tras comparar redes con dos algoritmos distintos: con la distancia euclídea (tras vectorizar los grafos considerando algunas de sus características) y con la distancia espectral (basada en los valores propios de las redes).

Selección prototípica multivariante y segmentación discursiva en un corpus oral: el Corpus Oral de Referencia del Español en Contacto (COREC II)

Ponente: Rebeca Patricia Gómez Ruíz (Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 8 de mayo de 2026, 11:00.

Resumen: Este trabajo desarrolla una propuesta metodológica aplicable a tareas de procesamiento del lenguaje natural (PLN) sobre corpus orales. Por su naturaleza heterogénea, estos corpus presentan retos específicos que dificultan su procesamiento mediante herramientas de PLN entrenadas generalmente sobre datos escritos.

En este contexto y a partir de la necesidad surgida en el COREC de crear un corpus de referencia para la anotación lingüística automática, se plantean tres preguntas de investigación: (i) ¿cómo seleccionar una muestra representativa del corpus que optimice el proceso de etiquetado lingüístico?; (ii) ¿cómo segmentar las transcripciones ortográficas del habla en unidades discursivas que respeten la lógica de la oralidad y, al mismo tiempo, sean anotables automáticamente?; y (iii) ¿puede la decisión de segmentación interpretarse algebraicamente de modo que se explicite su organización interna, se justifique su implementación en cascada y ofrezca una lectura geométrica de la frontera discursiva?

Para responder a estas cuestiones, proponemos el siguiente flujo metodológico reproducible: a) una selección muestral prototípica robusta, filtrada por estrato lingüístico y basada en una representación vectorial multivariante, la distancia Manhattan (L1) y una penalización por ruido; b) una segmentación discursiva que interpreta las pausas transcritas como fronteras candidatas evaluables contextualmente mediante variables booleanas lingüísticas, cuya combinación determina, mediante una función de decisión, la aceptación o el rechazo de cada frontera; y c) una formalización algebraica del criterio de segmentación que, a partir de las configuraciones válidas de activación, caracteriza el subespacio que estas generan e identifica su núcleo común y sus ejes de variación.