Pasar al contenido principal

Análisis de Textos

El objetivo del curso es introducir los conceptos, los métodos y las aplicaciones principales del área Procesamiento de Lenguaje Natural, haciendo énfasis en problemas y enfoques actuales, basados principalmente en técnicas de Aprendizaje Automático. Se presentará un panorama completo de los desafíos que involucra el área y se experimentará con las herramientas y los recursos habituales, incluyendo alguna práctica orientada a problemas de dimensiones reales de gran desarrollo en la actualidad, como Análisis de Sentimientos y Extracción de Información en Redes Sociales.

Objetivos

El objetivo del curso es introducir los conceptos, los métodos y las aplicaciones principales del área Procesamiento de Lenguaje Natural, haciendo énfasis en problemas y enfoques actuales, basados principalmente en técnicas de Aprendizaje Automático. Se presentará un panorama completo de los desafíos que involucra el área y se experimentará con las herramientas y los recursos habituales, incluyendo alguna práctica orientada a problemas de dimensiones reales de gran desarrollo en la actualidad, como Análisis de Sentimientos y Extracción de Información en Redes Sociales.

Público objetivo
Estudiantes de posgrado en informática y áreas afines y profesionales interesados en el área de análisis de textos.
Temario

Introducción al Procesamiento de Lenguaje Natural Conceptos generales, niveles clásicos de análisis. Aplicaciones más comunes del área: traducción automática, resumen automático, extracción de información, análisis de textos de prensa y de redes sociales. Herramientas y recursos usuales: analizadores lingüísticos, corpus. Evaluación. Conceptos generales de gramática del español: Definiciones básicas: oración y sintagma, categorías gramaticales (léxicas y sintagmáticas), funciones sintácticas y semánticas. Análisis gramatical básico de oraciones. Tratamiento previo y procesamiento usual de los textos: Obtención de textos. Pre-procesamiento: limpieza, tokenización, lematización, stemming, pos-tagging. Análisis sintáctico y semántico: recursos disponibles, aplicaciones y problemas. Recursos léxicos. Corpus anotados. Métodos clásicos y actuales para el PLN: Métodos simbólicos (reglas). Métodos de aprendizaje automático basados en atributos. Modelos de datos de desarrollo reciente: representaciones distribuidas de palabras y aprendizaje profundo. Problemas actuales del área: Análisis de sentimientos. Extracción de información.

Conocimientos exigidos
Programación.
Conocimientos deseables
Lenguajes Formales, Aprendizaje Automático, Probabilidad y Estadística, Álgebra.
Metodología de evaluación

Informe sobre el proyecto final (grupal). Prueba escrita individual presencial.

Detalles
Créditos
4
Arancel
19200
Inicio de curso
Fin de curso
Horario
Martes y jueves de 18 a 21 hs.
Docentes
Aiala Rosá, Juan José Prada