Extraccion de entidades con nombre
- Autores
- Pérez Abelleira, M. Alicia; Cardoso, Carolina A.
- Año de publicación
- 2012
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.
Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.
Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. - Materia
-
Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Católica de Salta
- OAI Identificador
- oai:bibliotecas.ucasal.edu.ar:60549
Ver los metadatos del registro completo
id |
RIUCASAL_0f8c5b7b27dc10da8393a827e202bfaf |
---|---|
oai_identifier_str |
oai:bibliotecas.ucasal.edu.ar:60549 |
network_acronym_str |
RIUCASAL |
repository_id_str |
3930 |
network_name_str |
Repositorio Institucional (UCaSal) |
spelling |
Extraccion de entidades con nombrePérez Abelleira, M. AliciaCardoso, Carolina A.Análisis automático de textosBase de datos a texto completoTratamiento de textosEl uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina.Universidad Católica de Salta. Facultad de Ingeniería (Salta)2012-12-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttps://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=605496054920161201u u u0frey0103 baspaCuadernos de Ingeniería1001514Salta (province)info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)reponame:Repositorio Institucional (UCaSal)instname:Universidad Católica de Saltainstacron:UCaSal2025-09-29T14:29:43Zoai:bibliotecas.ucasal.edu.ar:60549Institucionalhttp://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=16Universidad privadaNo correspondehttp://bibliotecas.ucasal.edu.ar/ws/oai2_7?verb=Identifycdiedrich@ucasal.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:39302025-09-29 14:29:44.244Repositorio Institucional (UCaSal) - Universidad Católica de Saltafalse |
dc.title.none.fl_str_mv |
Extraccion de entidades con nombre |
title |
Extraccion de entidades con nombre |
spellingShingle |
Extraccion de entidades con nombre Pérez Abelleira, M. Alicia Análisis automático de textos Base de datos a texto completo Tratamiento de textos |
title_short |
Extraccion de entidades con nombre |
title_full |
Extraccion de entidades con nombre |
title_fullStr |
Extraccion de entidades con nombre |
title_full_unstemmed |
Extraccion de entidades con nombre |
title_sort |
Extraccion de entidades con nombre |
dc.creator.none.fl_str_mv |
Pérez Abelleira, M. Alicia Cardoso, Carolina A. |
author |
Pérez Abelleira, M. Alicia |
author_facet |
Pérez Abelleira, M. Alicia Cardoso, Carolina A. |
author_role |
author |
author2 |
Cardoso, Carolina A. |
author2_role |
author |
dc.subject.none.fl_str_mv |
Análisis automático de textos Base de datos a texto completo Tratamiento de textos |
topic |
Análisis automático de textos Base de datos a texto completo Tratamiento de textos |
dc.description.none.fl_txt_mv |
El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre. Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. |
description |
El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012-12-30 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549 60549 20161201u u u0frey0103 ba |
url |
https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549 |
identifier_str_mv |
60549 20161201u u u0frey0103 ba |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
Cuadernos de Ingeniería |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
1001514 Salta (province) |
dc.publisher.none.fl_str_mv |
Universidad Católica de Salta. Facultad de Ingeniería (Salta) |
publisher.none.fl_str_mv |
Universidad Católica de Salta. Facultad de Ingeniería (Salta) |
dc.source.none.fl_str_mv |
reponame:Repositorio Institucional (UCaSal) instname:Universidad Católica de Salta instacron:UCaSal |
reponame_str |
Repositorio Institucional (UCaSal) |
collection |
Repositorio Institucional (UCaSal) |
instname_str |
Universidad Católica de Salta |
instacron_str |
UCaSal |
institution |
UCaSal |
repository.name.fl_str_mv |
Repositorio Institucional (UCaSal) - Universidad Católica de Salta |
repository.mail.fl_str_mv |
cdiedrich@ucasal.edu.ar |
_version_ |
1844621829365301248 |
score |
12.559606 |