Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares

Autores
Spositto, Osvaldo Mario; Ryckeboer, Hugo Emilio; Ledesma, Viviana; Procopio, Gastón; Matteo, Lorena; Gargano, Cecilia; Bossero, Julio; Moreno, Edgardo J.; Saizar, Victoria; Macias, Patricio; Ojeda, Juan; Quintana, Fabio; Conti, Laura; García, Sergio; Pérez Villar, Gustavo
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en este artículo se presenta una propuesta para incorporar, en un corpus jurídico, las fechas y las referencias de la norma jurídica, mediante el Reconocimiento de Entidades Nombradas (tales como Acordadas, Artículos, Leyes, entre otros), que componen los distintos documentos judiciales, utilizando Expresiones Regulares (ER). Estas cadenas de caracteres se utilizan para describir o encontrar patrones dentro de otros textos, empleando delimitadores y reglas de sintaxis. Se propone una metodología que permita identificar, clasificar y reemplazar estas entradas automáticamente, con el objetivo de ser normalizas. Por último, se presenta una propuesta para incorporar en un algoritmo de Lematización, la codificacion del proceso mencionado usando ER.
Workshop: Track “Gobierno Digital y Ciudades Inteligentes”
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Corpus
Expresiones regulares
Sistema de recuperación de documento
Lematización
Reconocimiento de entidades nombradas
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/130541

id SEDICI_2ce091608a2df0263e92a8c00b5317fe
oai_identifier_str oai:sedici.unlp.edu.ar:10915/130541
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones RegularesSpositto, Osvaldo MarioRyckeboer, Hugo EmilioLedesma, VivianaProcopio, GastónMatteo, LorenaGargano, CeciliaBossero, JulioMoreno, Edgardo J.Saizar, VictoriaMacias, PatricioOjeda, JuanQuintana, FabioConti, LauraGarcía, SergioPérez Villar, GustavoCiencias InformáticasCorpusExpresiones regularesSistema de recuperación de documentoLematizaciónReconocimiento de entidades nombradasEn la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en este artículo se presenta una propuesta para incorporar, en un corpus jurídico, las fechas y las referencias de la norma jurídica, mediante el Reconocimiento de Entidades Nombradas (tales como Acordadas, Artículos, Leyes, entre otros), que componen los distintos documentos judiciales, utilizando Expresiones Regulares (ER). Estas cadenas de caracteres se utilizan para describir o encontrar patrones dentro de otros textos, empleando delimitadores y reglas de sintaxis. Se propone una metodología que permita identificar, clasificar y reemplazar estas entradas automáticamente, con el objetivo de ser normalizas. Por último, se presenta una propuesta para incorporar en un algoritmo de Lematización, la codificacion del proceso mencionado usando ER.Workshop: Track “Gobierno Digital y Ciudades Inteligentes”Red de Universidades con Carreras en Informática2021-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf746-755http://sedici.unlp.edu.ar/handle/10915/130541spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-633-574-4info:eu-repo/semantics/reference/hdl/10915/129809info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T11:04:57Zoai:sedici.unlp.edu.ar:10915/130541Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 11:04:58.401SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
title Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
spellingShingle Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
Spositto, Osvaldo Mario
Ciencias Informáticas
Corpus
Expresiones regulares
Sistema de recuperación de documento
Lematización
Reconocimiento de entidades nombradas
title_short Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
title_full Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
title_fullStr Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
title_full_unstemmed Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
title_sort Propuesta para la construcción de un Corpus Jurídico utilizando Expresiones Regulares
dc.creator.none.fl_str_mv Spositto, Osvaldo Mario
Ryckeboer, Hugo Emilio
Ledesma, Viviana
Procopio, Gastón
Matteo, Lorena
Gargano, Cecilia
Bossero, Julio
Moreno, Edgardo J.
Saizar, Victoria
Macias, Patricio
Ojeda, Juan
Quintana, Fabio
Conti, Laura
García, Sergio
Pérez Villar, Gustavo
author Spositto, Osvaldo Mario
author_facet Spositto, Osvaldo Mario
Ryckeboer, Hugo Emilio
Ledesma, Viviana
Procopio, Gastón
Matteo, Lorena
Gargano, Cecilia
Bossero, Julio
Moreno, Edgardo J.
Saizar, Victoria
Macias, Patricio
Ojeda, Juan
Quintana, Fabio
Conti, Laura
García, Sergio
Pérez Villar, Gustavo
author_role author
author2 Ryckeboer, Hugo Emilio
Ledesma, Viviana
Procopio, Gastón
Matteo, Lorena
Gargano, Cecilia
Bossero, Julio
Moreno, Edgardo J.
Saizar, Victoria
Macias, Patricio
Ojeda, Juan
Quintana, Fabio
Conti, Laura
García, Sergio
Pérez Villar, Gustavo
author2_role author
author
author
author
author
author
author
author
author
author
author
author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Corpus
Expresiones regulares
Sistema de recuperación de documento
Lematización
Reconocimiento de entidades nombradas
topic Ciencias Informáticas
Corpus
Expresiones regulares
Sistema de recuperación de documento
Lematización
Reconocimiento de entidades nombradas
dc.description.none.fl_txt_mv En la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en este artículo se presenta una propuesta para incorporar, en un corpus jurídico, las fechas y las referencias de la norma jurídica, mediante el Reconocimiento de Entidades Nombradas (tales como Acordadas, Artículos, Leyes, entre otros), que componen los distintos documentos judiciales, utilizando Expresiones Regulares (ER). Estas cadenas de caracteres se utilizan para describir o encontrar patrones dentro de otros textos, empleando delimitadores y reglas de sintaxis. Se propone una metodología que permita identificar, clasificar y reemplazar estas entradas automáticamente, con el objetivo de ser normalizas. Por último, se presenta una propuesta para incorporar en un algoritmo de Lematización, la codificacion del proceso mencionado usando ER.
Workshop: Track “Gobierno Digital y Ciudades Inteligentes”
Red de Universidades con Carreras en Informática
description En la última década, la construcción de corpus de distintas especialidades ha tenido un amplio desarrollo, debido en gran parte, por su incorporación en el proceso de recuperación de la información. Si bien, en el sistema jurídico argentino, existen varios buscadores de expedientes digitales, en este artículo se presenta una propuesta para incorporar, en un corpus jurídico, las fechas y las referencias de la norma jurídica, mediante el Reconocimiento de Entidades Nombradas (tales como Acordadas, Artículos, Leyes, entre otros), que componen los distintos documentos judiciales, utilizando Expresiones Regulares (ER). Estas cadenas de caracteres se utilizan para describir o encontrar patrones dentro de otros textos, empleando delimitadores y reglas de sintaxis. Se propone una metodología que permita identificar, clasificar y reemplazar estas entradas automáticamente, con el objetivo de ser normalizas. Por último, se presenta una propuesta para incorporar en un algoritmo de Lematización, la codificacion del proceso mencionado usando ER.
publishDate 2021
dc.date.none.fl_str_mv 2021-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/130541
url http://sedici.unlp.edu.ar/handle/10915/130541
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-633-574-4
info:eu-repo/semantics/reference/hdl/10915/129809
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
746-755
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260549557026816
score 13.13397