Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales

Autores
Rodríguez, Fernando Jorge
Año de publicación
2013
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Castaño, José Manuel
Descripción
El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.
Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
LENGUAJE NATURAL
ETIQUETADOR GRAMATICAL
TAGGING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000710_Rodriguez

id BDUBAFCEN_7a13ab9d694ab2f7e4cdde8be5cc45d6
oai_identifier_str seminario:seminario_nCOM000710_Rodriguez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Nuevas fuentes de información para entrenamiento de etiquetadores gramaticalesRodríguez, Fernando JorgeLENGUAJE NATURALETIQUETADOR GRAMATICALTAGGINGEl etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Manuel2013info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-04T09:49:19Zseminario:seminario_nCOM000710_RodriguezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-04 09:49:20.458Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
title Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
spellingShingle Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
Rodríguez, Fernando Jorge
LENGUAJE NATURAL
ETIQUETADOR GRAMATICAL
TAGGING
title_short Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
title_full Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
title_fullStr Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
title_full_unstemmed Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
title_sort Nuevas fuentes de información para entrenamiento de etiquetadores gramaticales
dc.creator.none.fl_str_mv Rodríguez, Fernando Jorge
author Rodríguez, Fernando Jorge
author_facet Rodríguez, Fernando Jorge
author_role author
dc.contributor.none.fl_str_mv Castaño, José Manuel
dc.subject.none.fl_str_mv LENGUAJE NATURAL
ETIQUETADOR GRAMATICAL
TAGGING
topic LENGUAJE NATURAL
ETIQUETADOR GRAMATICAL
TAGGING
dc.description.none.fl_txt_mv El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.
Fil: Rodríguez, Fernando Jorge. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El etiquetado gramatical, también conocido como tagging, POS tagging o simplemente POST, es el proceso de asignar una etiqueta gramatical a cada una de las palabras de un texto según su categoría exótica. Un tagger o etiquetador es un programa que realiza este proceso automáticamente. La mayor´ıa de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de un texto anotado previamente (corpus de entrenamiento). El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado. Vale observar que la generación de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada. En este trabajo buscamos suplir o complementar la falta de corpus de entrenamiento generando una nueva fuente de información (NFI) a partir de una fuente de información existente: un diccionario. Realizamos cuidadosos procesos de extracción de información gramatical sobre el diccionario evitando pérdida de la misma. Luego experimentamos utilizando la NFI como corpus de entrenamiento sobre etiquetadores de distintas bases teóricas y distintos corpora. Los resultados observados exhiben una leve mejora en el rendimiento de los etiquetadores.
publishDate 2013
dc.date.none.fl_str_mv 2013
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez
url https://hdl.handle.net/20.500.12110/seminario_nCOM000710_Rodriguez
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1842340718134165504
score 12.623145