Imagen de cubierta local
Imagen de cubierta local
Imagen de Google Jackets

Optimization of automata for natural language dependecy parsing / Martín Ariel Domínguez.

Por: Colaborador(es): Detalles de publicación: [S.l. : s.n. ], 2012.Descripción: xiii, 128 páginas : ilustraciones ; 30 cmTema(s):
Contenidos parciales:
Theoretical framework -- Joining automata to optimize split of POS tags -- Looking for the best language for dependency structure -- Optimizing automata for Unsupervised Dependency Parsing -- New set of POS Tags optimized -- Optimized Head Rules.
Nota de disertación: Tesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía y Física, 2012. Resumen: Los fenómenos del lenguaje natural han sido estudiados por la lingüística tradicional mucho antes de la invención de las computadoras. Con la aparición de la computación y la posibilidad de procesar grandes cantidades de datos, apareció un abordaje más empírico del estudio del lenguaje. Actualmente, podemos comprobar y derivar hipótesis a través de grandes cantidades de textos digitalizados. La presente tesis aborda las diferentes ventajas derivadas de la posibilidad tecnológica de refinar y justificar conocimiento previo basado en tratamientos más racionales del Procesamiento del Lenguaje Natural (PLN). Presentamos diferentes líneas de investigación en las cuales aplicamos métodos computacionales al PLN. En dos de ellas utilizamos Algoritmos Genéticos para inferir automáticamente soluciones basadas en datos a problemas que son resueltos habitualmente de manera manual. Es decir, en el primer trabajo, construimos un nuevo conjunto de categorías gramaticales, mientras que en el segundo, buscamos mejores maneras de encontrar núcleos de los constituyentes de las oraciones del lenguaje natural. En el último trabajo, vamos un paso más adelante y proponemos una arquitectura para construir analizadores sintácticos multi-idioma de manera no supervisada, que puedan aprender estructuras basados simplemente en una muestra de oraciones. Utilizamos el formalismo de Gramáticas Biléxicas como una manera de modelar las estructuras sintácticas de oraciones a lo largo de toda la tesis. Dado que las Gramáticas Biléxicas están basadas en autómatas finitos, heredamos su facilidad para ser aprendidas. Además, nuestros experimentos con estas gramáticas nos proporcionaron un entendimiento práctico acerca de sus propiedades. A partir de los tres trabajos mencionados, observamos que al utilizar autómatas podemos modelar estructuras sintácticas con diferentes fines. Los resultados que obtuvimos con las tres lineas de investigación son prometedores. En los dos primeros trabajos, los cuales tuvieron impacto en el análisis sintáctico supervisado de constituyentes, mejoramos el desempeño de dos analizadores de constituyentes con resultados en el estado del arte. En nuestro tercer trabajo, obtuvimos resultados en el estado del arte con nuestro analizador de dependencias no supervisados para ocho idiomas diferentes.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título.
Existencias
Tipo de ítem Biblioteca actual Signatura Copia número Estado Notas Fecha de vencimiento Código de barras Reserva de ítems
Tesis de Doctorado Tesis de Doctorado FaMAF Vitrina T C DOM 1 Disponible Ej. de CONSULTA. 21451
Total de reservas: 0

Título en castellano : Optimización de autómatas para el análisis de dependencias del lenguaje natural.

Incluye listas de figuras, de tablas y anexos.

Tesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía y Física, 2012.

Bibliografía : p. 117-128.

Los fenómenos del lenguaje natural han sido estudiados por la lingüística tradicional mucho antes de la invención de las computadoras. Con la aparición de la computación y la posibilidad de procesar grandes cantidades de datos, apareció un abordaje más empírico del estudio del lenguaje. Actualmente, podemos comprobar y derivar hipótesis a través de grandes cantidades de textos digitalizados. La presente tesis aborda las diferentes ventajas derivadas de la posibilidad tecnológica de refinar y justificar conocimiento previo basado en tratamientos más racionales del Procesamiento del Lenguaje Natural (PLN). Presentamos diferentes líneas de investigación en las cuales aplicamos métodos computacionales al PLN. En dos de ellas utilizamos Algoritmos Genéticos para inferir automáticamente soluciones basadas en datos a problemas que son resueltos habitualmente de manera manual. Es decir, en el primer trabajo, construimos un nuevo conjunto de categorías gramaticales, mientras que en el segundo, buscamos mejores maneras de encontrar núcleos de los constituyentes de las oraciones del lenguaje natural. En el último trabajo, vamos un paso más adelante y proponemos una arquitectura para construir analizadores sintácticos multi-idioma de manera no supervisada, que puedan aprender estructuras basados simplemente en una muestra de oraciones. Utilizamos el formalismo de Gramáticas Biléxicas como una manera de modelar las estructuras sintácticas de oraciones a lo largo de toda la tesis. Dado que las Gramáticas Biléxicas están basadas en autómatas finitos, heredamos su facilidad para ser aprendidas. Además, nuestros experimentos con estas gramáticas nos proporcionaron un entendimiento práctico acerca de sus propiedades. A partir de los tres trabajos mencionados, observamos que al utilizar autómatas podemos modelar estructuras sintácticas con diferentes fines. Los resultados que obtuvimos con las tres lineas de investigación son prometedores. En los dos primeros trabajos, los cuales tuvieron impacto en el análisis sintáctico supervisado de constituyentes, mejoramos el desempeño de dos analizadores de constituyentes con resultados en el estado del arte. En nuestro tercer trabajo, obtuvimos resultados en el estado del arte con nuestro analizador de dependencias no supervisados para ocho idiomas diferentes.

Texto en inglés.

Haga clic en una imagen para verla en el visor de imágenes

Imagen de cubierta local


Nuestras Redes Sociales

facebook Instagram

Horario de la Biblioteca: lunes a viernes de 8:30 a 18:30hs

Av. Medina Allende s/n , Ciudad Universitaria, Córdoba, Argentina

Tel: +54 351 5353701 int. 41127 (Atención al Público) int. 41151 (Dirección)

biblio@famaf.unc.edu.ar (Dirección)

publicofamaf@gmail.com (Atención al público)