Reconocimiento de entidades nombradas en texto de dominio legal
- Autores
- Haag, Karen Yanet
- Año de publicación
- 2019
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Cardellino, Cristian Adrián
- Descripción
- Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.
This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.
info:eu-repo/semantics/publishedVersion
Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Aprendizaje automático
Entidades nombradas
Anotación semántica
Expresiones regulares
Documentos legales
Computing methodologies - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/15323
Ver los metadatos del registro completo
id |
RDUUNC_cb86a9467f48f17380e975ace965146b |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/15323 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Reconocimiento de entidades nombradas en texto de dominio legalHaag, Karen YanetAprendizaje automáticoEntidades nombradasAnotación semánticaExpresiones regularesDocumentos legalesComputing methodologiesTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente.This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source.info:eu-repo/semantics/publishedVersionFil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Cardellino, Cristian Adrián2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/15323spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-04T12:33:21Zoai:rdu.unc.edu.ar:11086/15323Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-04 12:33:21.995Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Reconocimiento de entidades nombradas en texto de dominio legal |
title |
Reconocimiento de entidades nombradas en texto de dominio legal |
spellingShingle |
Reconocimiento de entidades nombradas en texto de dominio legal Haag, Karen Yanet Aprendizaje automático Entidades nombradas Anotación semántica Expresiones regulares Documentos legales Computing methodologies |
title_short |
Reconocimiento de entidades nombradas en texto de dominio legal |
title_full |
Reconocimiento de entidades nombradas en texto de dominio legal |
title_fullStr |
Reconocimiento de entidades nombradas en texto de dominio legal |
title_full_unstemmed |
Reconocimiento de entidades nombradas en texto de dominio legal |
title_sort |
Reconocimiento de entidades nombradas en texto de dominio legal |
dc.creator.none.fl_str_mv |
Haag, Karen Yanet |
author |
Haag, Karen Yanet |
author_facet |
Haag, Karen Yanet |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cardellino, Cristian Adrián |
dc.subject.none.fl_str_mv |
Aprendizaje automático Entidades nombradas Anotación semántica Expresiones regulares Documentos legales Computing methodologies |
topic |
Aprendizaje automático Entidades nombradas Anotación semántica Expresiones regulares Documentos legales Computing methodologies |
dc.description.none.fl_txt_mv |
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019. Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. Este trabajo se centra en la detección, clasificación y anotación de entidades nombradas (como Leyes, Resoluciones o Decretos, entre otros) para el corpus de InfoLEG, una base de datos que contiene los documentos de todas las leyes de la República Argentina. En primera instancia se hizo reconocimiento mediante patrones definidos por expresiones regulares. Luego, se entrenó y evaluó un modelo basado en aprendizaje automático para tratar entidades que no eran regulares y así poder ampliar la cantidad de instancias capturadas. Por último, se realizó una aproximación utilizando anotación semántica para cada entidad y obtener así el acceso a la fuente de información correspondiente. This work focuses on detection, classification and annotation of named entities (such as laws, resolutions or decrees, among others) for the corpus of InfoLEG, a database that contains the documents of all the laws of the Argentine Republic. In the first instance, recognition was done using patterns defined by regular expressions. Then, a model based on machine learning was trained and evaluated to deal with entities that were not regular and thus be able to expand the number of captured instances. Finally, an approximation was made using semantic annotation for each entity and thus obtain access to the corresponding information source. info:eu-repo/semantics/publishedVersion Fil: Haag, Karen Yanet. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
description |
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
status_str |
publishedVersion |
format |
bachelorThesis |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/15323 |
url |
http://hdl.handle.net/11086/15323 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1842349659349057536 |
score |
13.13397 |