La perplejidad como herramienta para estimar la asignación de nivel de competencia en escritos de una lengua extranjera

Ponente: Gadea Mata Martínez (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: miércoles 13 de septiembre de 2023, 12:00.

Resumen: la asignación de niveles de competencia a escritos producidos por aprendices de una lengua es una tarea altamente subjetiva. Es por esto que el desarrollo de métodos que evalúen escritos de manera automática puede ayudar tanto al profesorado como al alumnado. En este trabajo, hemos explorado dos vías mediante el uso del corpus CAES. Dicho corpus está formado por escritos de aprendices de español y etiquetado con niveles CEFR (hasta el C1). La primera aproximación es un modelo de aprendizaje profundo llamado Deep-ELE que asigna niveles de competencia a las frases. La segunda aproximación llevada a cabo ha consistido en estudiar la perplejidad de las frases de los estudiantes de distintos niveles, para luego clasificarlos en niveles. Ambas aproximaciones han sido evaluadas, y se ha comprobado que pueden usarse de manera exitosa para clasificar frases por niveles. En concreto, el modelo Deep-ELE obtiene una accuracy de 81,3% y un QWK de 0,83. Como conclusión, este trabajo es un paso para entender cómo las herramientas del procesado de lenguaje natural pueden ayudar a las personas que aprenden un segundo idioma.

Nota: la charla se trata de una prueba de tiempo de la ponencia que presentará Gadea en el XXXIX Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (Jaén, 27-29 de septiembre de 2023, http://sepln2023.sepln.org/).

An Algorithm for translation of a Natural Language Question into SQL query

Ponente: Mariya Zhekova (Assistant Professor, University of Food Technologies in Plovdiv, Bulgaria).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 7 de septiembre de 2023, 12:00.

Resumen: The research is a crossroads in the fields of Informatics and Computational Linguistics and illustrates the understanding and interpretation of texts in natural language by computers. In it, the computer is trained with the help of grammar rules and classified linguistic corpora of possible word combinations of language units. The research presents an algorithm (a type of methodology) for creating a software module, independent of the programming language and of the query language, which copes with the task of extracting information from a relational database from a freely set user question. The goal can be achieved through pre-built models describing the considered domain area, rules, and question/query templates. The analytical capability of the proposed algorithm allows the language units identified by the question to be mapped to database objects, information about which can be found and returned in the form of a response from the system. Logical programming methods and processing in the algorithm do not depend on the programming language and technologies used. The presented method for semantic search and information retrieval can be implemented absolutely independently to different information systems operating in the same domain area. From the experiments made with user questions, it can be concluded that the software tool based on the proposed algorithm copes with the task of transforming natural language text into a database query.

Nota: the following links contain some of the materials that were also part of the talk by Mariya:

The slides of the talk are also available through the following link.

CASABee: el primer software de análisis espermático para insectos

Ponente: Ana Romero Ibáñez (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 30 de mayo de 2023, 12:00.

Resumen: La calidad del semen producido por los zánganos determina el éxito reproductivo de las abejas y su supervivencia, por lo que el estudio de su calidad espermática es de gran interés tanto para estudios básicos como aplicados. En este campo, existe la necesidad de desarrollar métodos informáticos para el análisis automático de la calidad del semen específicamente adaptados a las abejas melíferas, ya que los programas existentes hasta ahora (desarrollados para mamíferos) no son de utilidad. En este trabajo presentamos el sistema CASABee, un software de código abierto diseñado específicamente para el análisis automático de la motilidad y concentración espermática en zánganos de abejas melíferas. Trabajo conjunto con Jose Divasón, Pilar Santolaria y Jesús Yániz.

Simplificación de textos médicos con procesamiento del lenguaje: el proyecto CLARA-MeD

Ponente: Leonardo Campillos Llanos (Científico Titular, Centro de Ciencias Humanas y Sociales — CCHS –, Consejo Superior de Investigaciones Científicas — CSIC –).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 23 de mayo de 2023, 12:00.

Resumen: La infinidad de términos en los textos médicos es una barrera lingüística para comprender sus contenidos. Los pacientes y usuarios no especializados a menudo requieren explicaciones acerca de los tecnicismos. Sin embargo, los profesionales sanitarios carecen del tiempo suficiente para aportar detalles a los pacientes sobre las patologías o procedimientos. La simplificación automática de textos es una tarea de procesamiento del lenguaje que puede ayudar a mejorar la comprensión de la información sanitaria. El proyecto CLARA-MeD tiene como objetivos: 1) la creación de recursos para el procesamiento del lenguaje médico en español; y 2) la experimentación en simplificación automática de textos de este dominio. El seminario presentará el trabajo en curso para abordar la tarea y se discutirán las perspectivas de nuestro trabajo. En primer lugar, la creación de recursos, en concreto, un reconocedor de entidades médicas y un corpus anotado sobre ensayos clínicos. En segundo lugar, el desarrollo de recursos para simplificación automática: un corpus comparable y paralelo de registro técnico y simplificado, y un léxico de términos médicos equivalentes en cada registro. Por último, se expondrán los resultados de experimentos iniciales combinando el uso del léxico médico y los modelos basados en aprendizaje profundo para simplificar frases técnicas.

The kernel of Sphynx

Ponente: Francis Sergeraert (Université Joseph Fourier – Grenoble 1).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 16 de mayo de 2023, 12:00.

Resumen: The Kenzo program was born thirty years ago. Taking account of the long experience of Kenzo, in particular of its relatively important defects, an entirely new version of Kenzo is currently being rewritten, called Sphynx. Thirty years later, our machines are much more powerful, allowing us to use all the resources of Common Lisp, in particular the Meta Object Protocol. The result is a text much closer to the very nature of the underlying mathematics, satisfying also the now common requirements: strict typing during the development, efficiency in production. The talk will explain the main components of the Sphynx program.

Explicabilidad de modelos de IA aplicados a docencia

Ponente: Jose Divasón Mallagaray (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 9 de mayo de 2023, 12:00.

Resumen: Muchos de los cursos universitarios incluyen la entrega de pequeños proyectos como parte de la evaluación. Normalmente, estos proyectos incluyen una parte más técnica (y objetiva de evaluar) y otra más creativa (y subjetiva), lo cual provoca que en el proceso de evaluación puedan surgir sesgos, discrepancias e inconsistencias, incluso aunque los distintos profesores se coordinen entre sí. En esta charla presentaremos una metodología para ayudar a la detección de estos problemas y su aplicación en una asignatura del Grado en Ingeniería Informática. La metodología está basada en una selección robusta de las características más importantes y el uso de técnicas de explicabilidad de modelos de caja negra, como LIME, ELI5 y SHAP

La orquestación como forma de vida. Introducción a Apache Airflow


Ponentes: Darío Pascual Morales (ML Architect / AI Engineer, SDG Group España), Víctor Galilea Martín (Data Engineer, SDG Group España).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 2 de mayo de 2023, 12:00.

Resumen: En este seminario veremos cómo orquestar cualquier proceso de forma programática.  En concreto profundizaremos en Apache Airflow la herramienta que, de facto, se ha convertido en un estándar dentro de este mundo. Repasaremos sus formas de despliegue, sus principales características y veremos cómo se construyen las plantillas de orquestación.

En busca de la transparencia del algoritmo. Nuevas problemáticas para el Derecho Público

Ponente: Sergio Capellán Ugalde (Máster de Acceso a la Abogacía, Universidad de La Rioja).

Lugar: Salón de Actos (Edificio CCT).

Hora: martes 25 de abril de 2023, 12:00.

Nota: se trata de una actividad conjunta con el Colectivo de Inteligencia Artificial e Inteligencia Social — CIAIS —.

Resumen: La implementación de sistemas algorítmicos en el funcionamiento de las Administraciones Públicas hace que surjan nuevas incógnitas y afecciones jurídicas. Entre ellas se plantea, en especial, los problemas de conocimiento sobre el funcionamiento y la lógica de aquellos sistemas con relevancia jurídica directa sobre la ciudadanía.

Así, la transparencia algorítmica se ha convertido en una cuestión de importancia creciente dentro del Derecho Administrativo. Conocer el funcionamiento de las nuevas aplicaciones utilizadas por la Administración resulta imprescindible para salvaguardar garantías básicas del Derecho Público, como la publicidad normativa y la motivación de las resoluciones, así como los derechos e intereses de la ciudadanía.

Se propone analizar los cauces jurídicos que permiten conocer la existencia de decisiones administrativas automatizadas a través de algoritmos, y acceder a su lógica interna. Posibilidades que, dado el marco jurídico vigente, aún precario, transitan por dos vías no exentas de dificultades: por un lado, el acceso a la información pública (en este caso algorítmica); por otro, los recursos que brinda la normativa sobre protección de datos de carácter personal (sobre todo, en lo que respecta a la elaboración de perfiles).

Las limitaciones de estos cauces, reveladas por cierta jurisprudencia reciente en la materia, aconsejan explorar otras soluciones técnicas y jurídicas más robustas y coherentes con los postulados del Derecho Público.

Desmontando la inteligencia de ChatGPT: ¿de qué nos quieren convencer?

Ponente: Julio Rubio García (Grupo PSYCOTRIP, Universidad de La Rioja).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 28 de marzo de 2023, 12:00.

Resumen (este resumen ha sido generado por ChatGPT a partir del título de la charla): En esta charla se discute la inteligencia detrás de ChatGPT, un modelo de lenguaje de gran escala entrenado por OpenAI. Se analiza la efectividad de ChatGPT y se cuestiona si su capacidad para generar respuestas coherentes y precisas es realmente una muestra de inteligencia. Además, se aborda el papel de la ética en la creación y uso de modelos de lenguaje de inteligencia artificial, incluyendo la necesidad de evitar la discriminación y el sesgo. En general, se busca desafiar las suposiciones comunes sobre la “inteligencia” de los modelos de lenguaje de IA y fomentar una discusión crítica sobre su desarrollo y uso.

Nota: esta charla formará parte del “Acto Inaugural del Colectivo de Inteligencia Artificial e Inteligencia Social — CIAIS” que tendrá lugar el miércoles 12 de abril a las 17:30 en el Ateneo Riojano (c. Muro de Cervantes 1, Logroño), y cuyo cartel se pueden encontrar a través de este enlace.

IA en la detección de enfermedades de la retina, del laboratorio a la práctica

Ponente: Dídac Royo Fibla (CEO, UPRetina), Miguel Ángel Zapata Victori (Director médico, Hospital Vall D’Hebron/UPRetina).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 24 de marzo de 2023, 10:00.

Resumen: UPRetina (https://www.upretina.com/en/) es una empresa que se dedica principalmente a la telemedicina en el campo de las enfermedades de la retina. Durante la charla comentaremos las principales líneas de trabajo, los primeros estudios y aplicaciones de la inteligencia artificial, así como las aplicaciones prácticas de redes neuronales que actualmente está utilizando UPRetina. Durante el encuentro se comentarán también las futuras líneas de investigación en inteligencia artificial previstas y otras líneas de trabajo que se están desarrollando en el mundo de la retina con el uso de la inteligencia artificial.