Algoritmos no supervisados para aprendizaje automático de una gramática formal del español mediante técnicas estadísticas de inducción de estructuras sintácticas

Código: 
Proyecto FFyL-UBA PRI
Período: 
Vie, 01/04/2011 - 09:00 - Sáb, 30/03/2013 - 18:00

El Argumento de la Pobreza de los Estímulos se presenta como el gran campo de debate epistemológico entre el paradigma simbólico y el paradigma estadístico en lingüística computacional. Desde 2000 en adelante aparecieron algunos trabajos dentro del paradigma estadístico que se propusieron atacar el Argumento de la Pobreza de los Estímulos a partir de la postulación de algún algoritmo general no supervisado de adquisición integral del lenguaje. Entre los aportes más importantes, la tesis de doctorado de Clark (2001) recurre a diversas técnicas estadísticas para dar con un algoritmo general no supervisado de inducción del lenguaje, y en particular, de una gramática independiente de contexto para el inglés. Otros trabajos, que también se incriben en el estado del arte, adoptan un modelo de dependencias (Klein y Manning 2004) o gramáticas de dos niveles (Infante-López 2005) para inducir estructura sintáctica.

Los investigadores del campo reconocen que es necesaria una mayor evidencia translingüística que apoye la plausibilidad psicolingüística de un aprendizaje general no supervisado de una gramática formal a partir de técnicas estadísticas. Actualmente, no existen trabajos que se hayan propuesto probar tales enfoques para la inducción de sintaxis en lenguas flexivas y con orden libre de constituyentes, como el español. Así pues, nuestro trabajo se propone contribuir con dicha evidencia translingüística, estudiando la factibilidad de aplicación sobre el español de los trabajos que describen el estado del arte en cuanto al aprendizaje automático no supervisado de estructuras sintácticas. 

Integrantes

  • Berros, Juan Manuel
  • Dell’Era, Diego

Director: 
Estado: 
En curso
  • Tipo de proyecto: