Reconocimiento de entidades nombradas en texto de dominio legal

Autores
Haag, Karen Yanet
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Cardellino, Cristian Adrián
Descripción
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.
This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.
info:eu-repo/semantics/publishedVersion
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Aprendizaje automático
Entidades nombradas
Anotación semántica
Expresiones regulares
Documentos legales
Computing methodologies
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/15323

id RDUUNC_cb86a9467f48f17380e975ace965146b
oai_identifier_str oai:rdu.unc.edu.ar:11086/15323
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Reconocimiento de entidades nombradas en texto de dominio legalHaag, Karen YanetAprendizaje automáticoEntidades nombradasAnotación semánticaExpresiones regularesDocumentos legalesComputing methodologiesTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.info:eu-repo/semantics/publishedVersionFil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Cardellino, Cristian Adrián2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/15323spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-04T12:33:21Zoai:rdu.unc.edu.ar:11086/15323Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-04 12:33:21.995Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Reconocimiento de entidades nombradas en texto de dominio legal
title Reconocimiento de entidades nombradas en texto de dominio legal
spellingShingle Reconocimiento de entidades nombradas en texto de dominio legal
Haag, Karen Yanet
Aprendizaje automático
Entidades nombradas
Anotación semántica
Expresiones regulares
Documentos legales
Computing methodologies
title_short Reconocimiento de entidades nombradas en texto de dominio legal
title_full Reconocimiento de entidades nombradas en texto de dominio legal
title_fullStr Reconocimiento de entidades nombradas en texto de dominio legal
title_full_unstemmed Reconocimiento de entidades nombradas en texto de dominio legal
title_sort Reconocimiento de entidades nombradas en texto de dominio legal
dc.creator.none.fl_str_mv Haag, Karen Yanet
author Haag, Karen Yanet
author_facet Haag, Karen Yanet
author_role author
dc.contributor.none.fl_str_mv Cardellino, Cristian Adrián
dc.subject.none.fl_str_mv Aprendizaje automático
Entidades nombradas
Anotación semántica
Expresiones regulares
Documentos legales
Computing methodologies
topic Aprendizaje automático
Entidades nombradas
Anotación semántica
Expresiones regulares
Documentos legales
Computing methodologies
dc.description.none.fl_txt_mv Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.
This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.
info:eu-repo/semantics/publishedVersion
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
status_str publishedVersion
format bachelorThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/15323
url http://hdl.handle.net/11086/15323
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1842349659349057536
score 13.13397