Introducción al procesamiento del lenguaje natural

Área formativa

Materiales y Recursos Educativos Digitales

Universidad organizadora

Universidad de Zaragoza

Profesores para su impartición

Jorge Gracia del Río

Descripción

El "procesamiento del lenguaje natural" (PLN) estudia la interacción entre las computadoras y el lenguaje con el fin de procesar e interpretar el lenguaje humano mediante modelos formales y métodos algorítmicos y estadísticos. Es un área que se ubica en la intersección entre las ciencias de la computación, la inteligencia artificial y la lingüística. Sus aplicaciones son múltiples y van desde los agentes conversacionales (ej.: Siri), el análisis de sentimientos en redes sociales, la traducción automática, o la búsqueda de información en la Web. También los estudios en lingüística y humanidades se pueden beneficiar de dichas técnicas para realizar tareas como extracción de terminologías, clasificación de textos, etc. Este curso introducirá al alumno en el tema del PLN y las tecnologías que lo sustentan, dando una visión general con un enfoque divulgativo y práctico y sin entrar a fondo en sus formalismos teóricos. El curso dotará a los estudiantes de lingüística y áreas afines de una visión, difícil de obtener en sus estudios de grado, de lo que la tecnología y la ingeniería pueden aportar para ayudar a resolver problemas relacionados con el procesamiento del lenguaje y que podrían ser de utilidad para sus propios objetivos (clasificación de textos, descubrimiento de entidades, medida de relaciones semánticas, anotaciones sintácticas, …). Por otra parte, los alumnos de áreas científico-técnicas obtendrán una visión de las muchas aplicaciones y técnicas del PLN, así como de la importancia de la lingüística para resolver ciertos problemas tecnológicos en la interacción hombre-máquina. Se incentivará la formación de grupos interdisciplinares y se estimulará la cooperación entre alumnos de diferente especialización.

Objetivos

El alumno adquirirá un conocimiento general del PLN, será capaz de identificar problemas y posibles soluciones en dicha área, y adquirirá un dominio básico de algunas de sus tecnologías asociadas. Así mismo, es de esperar que mejoren sus capacidades de trabajo en grupo en entornos multidisciplinares

Programa

Tema 1 - Conceptos básicos, historia y aplicaciones del PLN Tema 2 - Principales librerías abiertas de PLN Tema 3 - Extracción de entidades Tema 4 - Corpus Tema 5 - Representación de sentidos: catálogos de sentidos Tema 6 - Representación de sentidos: semántica distribucional y word embeddings Tema 7 - Medidas semánticas y desambiguación de sentidos Tema 8 – Modelos del lenguaje contemporáneos (BERT, GPT-3) Tema 9 - Datos lingüísticos enlazados Se contará con la participación de algún ponente invitado y habrá una sesión final dedicada a la defensa de los trabajos prácticos

Metodología

Habrá 12 horas de clase que se emitirán por videoconferencia (Google Meet) y quedarán grabadas para el seguimiento de estas por los alumnos. La actividad incluye también tutorías personalizadas (3 horas). Se estima que el tiempo de trabajo personal requerido para asimilar los contenidos y llevar a cabo los trabajos prácticos es de 15 horas, por lo que la dedicación total del alumno, entre actividades lectivas y trabajo personal, es de unas 30 horas.

Evaluación

La actividad se evaluará en base a la realización de un cuestionario con preguntas sobre el temario impartido. También se basará en la realización de un trabajo final que, a elección del alumno, podrá ser de carácter práctico (programa informático) o bien elaborando una memoria escrita sobre alguno de los contenidos de la actividad.

Duración

15 horas

Fecha inicio - Fin

4/10/2021 - 29/11/2021

Observaciones

Actividad dirigida tanto a alumnos de áreas científico-técnicas (informática) como de humanidades (lingüística). A los alumnos de perfil científico/técnico se les pedirá conocimientos previos en algún lenguaje de programación (preferiblemente Java, Python, o C++). A los alumnos de lingüística/humanidades no se les aplicará tal requisito.