Simplificación de textos médicos con procesamiento del lenguaje: el proyecto CLARA-MeD

Ponente: Leonardo Campillos Llanos (Científico Titular, Centro de Ciencias Humanas y Sociales — CCHS –, Consejo Superior de Investigaciones Científicas — CSIC –).

Lugar: Seminario Mirian Andrés (Edificio CCT).

Hora: martes 23 de mayo de 2023, 12:00.

Resumen: La infinidad de términos en los textos médicos es una barrera lingüística para comprender sus contenidos. Los pacientes y usuarios no especializados a menudo requieren explicaciones acerca de los tecnicismos. Sin embargo, los profesionales sanitarios carecen del tiempo suficiente para aportar detalles a los pacientes sobre las patologías o procedimientos. La simplificación automática de textos es una tarea de procesamiento del lenguaje que puede ayudar a mejorar la comprensión de la información sanitaria. El proyecto CLARA-MeD tiene como objetivos: 1) la creación de recursos para el procesamiento del lenguaje médico en español; y 2) la experimentación en simplificación automática de textos de este dominio. El seminario presentará el trabajo en curso para abordar la tarea y se discutirán las perspectivas de nuestro trabajo. En primer lugar, la creación de recursos, en concreto, un reconocedor de entidades médicas y un corpus anotado sobre ensayos clínicos. En segundo lugar, el desarrollo de recursos para simplificación automática: un corpus comparable y paralelo de registro técnico y simplificado, y un léxico de términos médicos equivalentes en cada registro. Por último, se expondrán los resultados de experimentos iniciales combinando el uso del léxico médico y los modelos basados en aprendizaje profundo para simplificar frases técnicas.