Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
- Autores
- Rodríguez, Fernando Jorge
- Año de publicación
- 2013
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Castaño, José Manuel
- Descripción
- El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.
Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
LENGUAJE NATURAL
ETIQUETADOR GRAMATICAL
TAGGING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000710_Rodriguez
Ver los metadatos del registro completo
id |
BDUBAFCEN_7a13ab9d694ab2f7e4cdde8be5cc45d6 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000710_Rodriguez |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticalesRodríguez, Fernando JorgeLENGUAJE NATURALETIQUETADOR GRAMATICALTAGGINGEl etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Manuel2013info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-04T09:49:19Zseminario:seminario_nCOM000710_RodriguezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-04 09:49:20.458Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
title |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
spellingShingle |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales Rodríguez, Fernando Jorge LENGUAJE NATURAL ETIQUETADOR GRAMATICAL TAGGING |
title_short |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
title_full |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
title_fullStr |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
title_full_unstemmed |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
title_sort |
Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales |
dc.creator.none.fl_str_mv |
Rodríguez, Fernando Jorge |
author |
Rodríguez, Fernando Jorge |
author_facet |
Rodríguez, Fernando Jorge |
author_role |
author |
dc.contributor.none.fl_str_mv |
Castaño, José Manuel |
dc.subject.none.fl_str_mv |
LENGUAJE NATURAL ETIQUETADOR GRAMATICAL TAGGING |
topic |
LENGUAJE NATURAL ETIQUETADOR GRAMATICAL TAGGING |
dc.description.none.fl_txt_mv |
El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores. Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1842340718134165504 |
score |
12.623145 |