Extraccion de entidades con nombre

Autores
Pérez Abelleira, M. Alicia; Cardoso, Carolina A.
Año de publicación
2012
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.
Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.
Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.
Materia
Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Repositorio Institucional (UCaSal)
Institución
Universidad Católica de Salta
OAI Identificador
oai:bibliotecas.ucasal.edu.ar:60549

id RIUCASAL_0f8c5b7b27dc10da8393a827e202bfaf
oai_identifier_str oai:bibliotecas.ucasal.edu.ar:60549
network_acronym_str RIUCASAL
repository_id_str 3930
network_name_str Repositorio Institucional (UCaSal)
spelling Extraccion de entidades con nombrePérez Abelleira, M. AliciaCardoso, Carolina A.Análisis automático de textosBase de datos a texto completoTratamiento de textosEl uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.Universidad Católica de Salta. Facultad de Ingeniería (Salta)2012-12-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttps://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=605496054920161201u u u0frey0103 baspaCuadernos de Ingeniería1001514Salta (province)info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)reponame:Repositorio Institucional (UCaSal)instname:Universidad Católica de Saltainstacron:UCaSal2025-09-29T14:29:43Zoai:bibliotecas.ucasal.edu.ar:60549Institucionalhttp://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=16Universidad privadaNo correspondehttp://bibliotecas.ucasal.edu.ar/ws/oai2_7?verb=Identifycdiedrich@ucasal.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:39302025-09-29 14:29:44.244Repositorio Institucional (UCaSal) - Universidad Católica de Saltafalse
dc.title.none.fl_str_mv Extraccion de entidades con nombre
title Extraccion de entidades con nombre
spellingShingle Extraccion de entidades con nombre
Pérez Abelleira, M. Alicia
Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
title_short Extraccion de entidades con nombre
title_full Extraccion de entidades con nombre
title_fullStr Extraccion de entidades con nombre
title_full_unstemmed Extraccion de entidades con nombre
title_sort Extraccion de entidades con nombre
dc.creator.none.fl_str_mv Pérez Abelleira, M. Alicia
Cardoso, Carolina A.
author Pérez Abelleira, M. Alicia
author_facet Pérez Abelleira, M. Alicia
Cardoso, Carolina A.
author_role author
author2 Cardoso, Carolina A.
author2_role author
dc.subject.none.fl_str_mv Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
topic Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
dc.description.none.fl_txt_mv El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.
Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.
Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.
description El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.
publishDate 2012
dc.date.none.fl_str_mv 2012-12-30
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549
60549
20161201u u u0frey0103 ba
url https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549
identifier_str_mv 60549
20161201u u u0frey0103 ba
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv Cuadernos de Ingeniería
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv 1001514
Salta (province)
dc.publisher.none.fl_str_mv Universidad Católica de Salta. Facultad de Ingeniería (Salta)
publisher.none.fl_str_mv Universidad Católica de Salta. Facultad de Ingeniería (Salta)
dc.source.none.fl_str_mv reponame:Repositorio Institucional (UCaSal)
instname:Universidad Católica de Salta
instacron:UCaSal
reponame_str Repositorio Institucional (UCaSal)
collection Repositorio Institucional (UCaSal)
instname_str Universidad Católica de Salta
instacron_str UCaSal
institution UCaSal
repository.name.fl_str_mv Repositorio Institucional (UCaSal) - Universidad Católica de Salta
repository.mail.fl_str_mv cdiedrich@ucasal.edu.ar
_version_ 1844621829365301248
score 12.559606