Una perspectiva de las técnicas de entrenamiento de los LLMs: el caso de RigoChat

Ponente: Gonzalo Santamaría (Instituto de Ingeniería del Conocimiento)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 27 de marzo de 2025, 09:10.

Resumen: En esta charla exploraremos las principales técnicas utilizadas para entrenar enormes modelos del lenguaje (LLMs por sus siglas en inglés), desde el pre-entrenamiento hasta las estrategias de aprendizaje supervisado y las diferentes técnicas de aprendizaje por refuerzo que existen para obtener estos modelos tan versátiles y potentes. Veremos las dificultades computacionales que existen dada la gran cantidad de memoria y velocidad que hacen falta para entrenar y utilizar estos modelos. Finalmente, explicaremos algunas estrategias para optimizarlos tanto en recursos requeridos como en precisión, ilustrando RigoChat v2 como ejemplo aplicado de un LLM diseñado para ser eficiente en algunas tareas específicas de interés en castellano.

Aplicación práctica de la Inteligencia Artificial en el e-learning

Ponente: Alfredo Anaya (ADR Formación)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 27 de febrero de 2025, 09:10.

Resumen: En ADR Formación llevamos haciendo e-learning con recursos propios desde el 1999 cuando empezamos a desarrollar eLysa, nuestro sistema de gestión de contenidos de aprendizaje (LCMS por las siglas en inglés de Learning Content Management System). Desde hace más de 4 años desarrollando proyectos de I+D+i de Inteligencia Artificial (IA) aplicados a la misma. En esta charla mostraremos la aplicación de la IA en la generación de contenidos (a través de nuestro sistema de autor) y en los procesos de impartición (eLysa LMS). Esto incluye funcionalidades como la generación de contenidos, la generación de actividades prácticas con rúbricas, o la creación de asistentes tanto para el alumnado como los tutores. Finalmente comentaremos algunas de las múltiples líneas de investigación en las que se están trabajando.

Gestión Descentralizada de la Identidad para Internet of Things: lecciones aprendidas

Ponente: Santiago de Diego (TECNALIA Research & Innovation)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 20 de febrero de 2025, 09:10.

Resumen: En esta charla se explorará el paradigma de la Self-Sovereign Identity (SSI) y su aplicación en el Internet of Things (IoT). La SSI es un enfoque innovador que permite a los individuos y dispositivos tener control total sobre sus identidades digitales, eliminando la necesidad de intermediarios centralizados. Se presentarán casos de uso donde la SSI mejora la seguridad y privacidad en el IoT. Además, se discutirán las tecnologías habilitadoras que permiten implementar SSI en IoT. Finalmente, se abordarán los desafíos y problemas encontrados a la hora de realizar dicha implementación, lo cual permitirá entender a los desarrolladores a qué desafíos se enfrentan. Además, se presentará una solución innovadora para la gestión de identidad de grupos de dispositivos que extiende el estándar W3C de Credenciales Verificables.

Aplicación de Lean al proceso de evaluación final de asignaturas del Grado en Ingeniería Informática de la UR

Ponente: Arturo Jaime Elizondo (Grupo PSYCOTRIP, Universidad de La Rioja) 

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 13 de febrero de 2025, 09:10.

Resumen: En esta charla-reunión se hablará de los avances obtenidos en el proyecto de innovación docente «Aplicación de métodos lean a procesos enseñanza-aprendizaje en el Grado de Ingeniería Informática: gestión de requisitos y revisión de exámenes», presentado en la actual convocatoria.

En particular, introducirán las ideas básicas de Lean aplicado a oficinas y servicios y se explicará cómo se ha utilizado hasta el momento para mejorar procesos educativos. Se expondrá el trabajo realizado hasta el momento sobre la evaluación final de las asignaturas, donde se han estudiado cuatro asignaturas (paseo por el «gemba»). Se ha creado un diagrama SIPOC (Suministrador-Entradas-Procesos-Salidas-Clientes), un diagrama de flujo de valor (VSM, Value Stream Mapping) de estado actual y se ha organizado un evento Kaizen para mejorar el paso de revisión de exámenes, tratando de reducir desperdicios (Muda) y de evitar sobrecargas o cuellos de botella (Muri).

El objetivo final de la charla será escuchar nuevas ideas y solicitar algunos datos para terminar de confeccionar un diagrama de estado futuro que intente diseñar un posible proceso estándar.

Asistentes conversacionales para el acceso a documentación en entorno empresarial

Ponente: Miguel González (SDG Group)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: jueves 6 de febrero de 2025, 09:10.

Resumen: Con el creciente interés y la mejora en el rendimiento de los LLMs, las empresas están demandando la creación de asistentes conversacionales que faciliten el acceso a la documentación de manera más natural. En esta charla presentaremos los flujos de desarrollo, los desafíos que hemos enfrentado y los componentes que se utilizarán para la toma de decisiones y la generación de respuestas.

Lisimetría, una herramienta agronómica clásica con nuevos desafíos en la era digital

Ponente: Joaquín Huete (SIAR, Servicio de Información Agroclimática de La Rioja)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 17 de enero de 2025, 10:00.

Resumen:

La lisimetría es una técnica que permite medir con gran precisión el consumo de agua de los cultivos, siendo esencial para evaluar el impacto de diversas prácticas agronómicas y apoyar la toma de decisiones en gestión hídrica. Aunque los lisímetros se han utilizado durante más de 300 años y los lisímetros de precisión existen desde la década de 1940, los avances recientes en tecnología de pesada y gestión de datos abren nuevos horizontes.

En este contexto, la Comunidad Autónoma de La Rioja ha implementado en los últimos años dos lisímetros de precisión de gran tamaño, junto con una instalación de seis minilisímetros, con el fin de fomentar la investigación en sostenibilidad agrícola. Su utilización plantea desafíos en la validación y la interpretación de la calidad de los datos obtenidos. Para abordar estos desafíos, hemos desarrollado un código informático que procesa la información recogida y genera distintos productos analíticos. Este enfoque tiene como objetivo estandarizar los procedimientos, minimizar errores y mejorar la eficiencia en la gestión de los datos generados por estas herramientas.

Del texto libre al estructurado: evaluación de modelos transformer en ensayos clínicos

Ponente: Leonardo Campillos Llanos (Consejo Superior de Investigaciones Científicas, CSIC)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 13 de diciembre de 2024, 10:00.

Resumen: El diseño de cohortes experimentales o el análisis de resultados de ensayos clínicos suele ser un proceso manual y costoso en términos de tiempo. Por ello, desde hace años se vienen aplicando técnicas de extracción de información para automatizar dichas tareas y obtener información estructurada de texto libre, especialmente con procesamiento del lenguaje natural. En una primera etapa, el reconocimiento de entidades médicas permite identificar las entidades de interés, como los estados patológicos, los fármacos o información temporal. Dichas menciones pueden normalizarse a identificadores de conceptos en tesauros de referencia, como el Unified Medical Language System (UMLS). En una segunda fase, las entidades extraídas pueden asociarse mediante relaciones semánticas, como entre un fármaco y su dosis. Este seminario expondrá los recursos y experimentos desarrollados para el español mediante la aplicación de modelos transformer, y mostrará un sistema de anotación semántica que implementa estos métodos.

Las redes neuronales que han ganado el Nobel de física

Ponente: Jon Ander Alonso Ortiz De Elguea (Alumni Universidad de La Rioja)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 29 de noviembre de 2024, 10:00.

Resumen: El Nobel de física de 2024 se lo han llevado dos pioneros de la inteligencia artificial, John Hopfield y Geoffrey Hinton, por la invención de las redes Hopfield y las máquinas Boltzmann. En esta charla explicamos en qué consisten estas redes y qué relación tienen con la física y el estado actual del aprendizaje profundo.

IGELA: La herramienta que transforma preguntas en aprendizaje

Ponente: Félix Lanas Mangado (Universidad de La Rioja)

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: viernes 22 de noviembre de 2024, 10:00.

Resumen: La charla se presenta como continuación del seminario «¿Realmente aprenden los estudiantes generando preguntas de test?«. En esta sesión presentaremos IGELA, una aplicación web libre desarrollada en el ámbito del proyecto prueba de concepto ReCREA. Diseñada para la generación y gestión de preguntas de test, IGELA destaca por su extraordinaria facilidad para ser compartida y desplegada por otros usuarios. Esta herramienta permite a los estudiantes crear preguntas, votar, sugerir mejoras, realizar tests, y a los profesores gestionar y evaluar todo el proceso desde un panel centralizado con una interfaz intuitiva y amigable.

Durante este seminario también exploraremos las anécdotas y desafíos que surgieron durante el desarrollo de la herramienta, y cómo los abordamos con creatividad e innovación para crear una solución funcional y efectiva.