Resolución de correferencias para la captura de eventos

Autores
Cantamutto, Lucía Marina; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural, aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación
The algorithm (proposed by Raghunathan et al. 2010) sequentially performs a series of pass of recognition, and allows to go incrementally proposing candidates to coreferenced between named entities in the text. The article briefly presents the work of adapting the algorithm Stanford Multi Pass Sieve and other analysis tools (OpeNer) to texts in Spanish (and other Agerri 2013, Bermúdez 2013). The result is a fragmented speech in sentences with full sense, that even being independent of the speech have not lost the discursive framework they belong (to inherit metadata documentaries). This can feed the event-based knowledge systems, or be linked to deposits of open data, or published independently (vg. as tweets). As a result, the article offers an example of manual analysis that, in further research, will be automatic.
Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca; Argentina. Universidad Nacional del Sur. Departamento de Humanidades; Argentina
Fil: Abaitua Odriozola, Joseba K.. Universidad de Deusto; España
Fil: Carballal, David Buján. Universidad de Deusto; España
Fil: Díaz Labrador, José Luis. Universidad de Deusto; España
Fil: Bermúdez, Josu. Universidad de Deusto; España
Materia
CORREFERENCIA
CAPTURA DE EVENTOS
ALGORITMOS DE RESOLUCIÓN
SIMPLE EVENT MODEL
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/77832

id CONICETDig_650664a4d3b24acd0bbb19aff446f639
oai_identifier_str oai:ri.conicet.gov.ar:11336/77832
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Resolución de correferencias para la captura de eventosCoreference resolution for capture of eventsCantamutto, Lucía MarinaAbaitua Odriozola, Joseba K.Carballal, David BujánDíaz Labrador, José LuisBermúdez, JosuCORREFERENCIACAPTURA DE EVENTOSALGORITMOS DE RESOLUCIÓNSIMPLE EVENT MODELhttps://purl.org/becyt/ford/1.7https://purl.org/becyt/ford/1El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural, aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigaciónThe algorithm (proposed by Raghunathan et al. 2010) sequentially performs a series of pass of recognition, and allows to go incrementally proposing candidates to coreferenced between named entities in the text. The article briefly presents the work of adapting the algorithm Stanford Multi Pass Sieve and other analysis tools (OpeNer) to texts in Spanish (and other Agerri 2013, Bermúdez 2013). The result is a fragmented speech in sentences with full sense, that even being independent of the speech have not lost the discursive framework they belong (to inherit metadata documentaries). This can feed the event-based knowledge systems, or be linked to deposits of open data, or published independently (vg. as tweets). As a result, the article offers an example of manual analysis that, in further research, will be automatic.Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca; Argentina. Universidad Nacional del Sur. Departamento de Humanidades; ArgentinaFil: Abaitua Odriozola, Joseba K.. Universidad de Deusto; EspañaFil: Carballal, David Buján. Universidad de Deusto; EspañaFil: Díaz Labrador, José Luis. Universidad de Deusto; EspañaFil: Bermúdez, Josu. Universidad de Deusto; EspañaUniversidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica2015-08info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/77832Cantamutto, Lucía Marina; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu; Resolución de correferencias para la captura de eventos; Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica; Pilquen; 18; 2; 8-2015; 40-491851-3123CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/https://dialnet.unirioja.es/ejemplar/410971info:eu-repo/semantics/altIdentifier/url/http://revele.uncoma.edu.ar/htdoc/revele/index.php/Sociales/article/view/1390info:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/2c3cchinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T10:38:10Zoai:ri.conicet.gov.ar:11336/77832instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 10:38:10.411CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Resolución de correferencias para la captura de eventos
Coreference resolution for capture of events
title Resolución de correferencias para la captura de eventos
spellingShingle Resolución de correferencias para la captura de eventos
Cantamutto, Lucía Marina
CORREFERENCIA
CAPTURA DE EVENTOS
ALGORITMOS DE RESOLUCIÓN
SIMPLE EVENT MODEL
title_short Resolución de correferencias para la captura de eventos
title_full Resolución de correferencias para la captura de eventos
title_fullStr Resolución de correferencias para la captura de eventos
title_full_unstemmed Resolución de correferencias para la captura de eventos
title_sort Resolución de correferencias para la captura de eventos
dc.creator.none.fl_str_mv Cantamutto, Lucía Marina
Abaitua Odriozola, Joseba K.
Carballal, David Buján
Díaz Labrador, José Luis
Bermúdez, Josu
author Cantamutto, Lucía Marina
author_facet Cantamutto, Lucía Marina
Abaitua Odriozola, Joseba K.
Carballal, David Buján
Díaz Labrador, José Luis
Bermúdez, Josu
author_role author
author2 Abaitua Odriozola, Joseba K.
Carballal, David Buján
Díaz Labrador, José Luis
Bermúdez, Josu
author2_role author
author
author
author
dc.subject.none.fl_str_mv CORREFERENCIA
CAPTURA DE EVENTOS
ALGORITMOS DE RESOLUCIÓN
SIMPLE EVENT MODEL
topic CORREFERENCIA
CAPTURA DE EVENTOS
ALGORITMOS DE RESOLUCIÓN
SIMPLE EVENT MODEL
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.7
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural, aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación
The algorithm (proposed by Raghunathan et al. 2010) sequentially performs a series of pass of recognition, and allows to go incrementally proposing candidates to coreferenced between named entities in the text. The article briefly presents the work of adapting the algorithm Stanford Multi Pass Sieve and other analysis tools (OpeNer) to texts in Spanish (and other Agerri 2013, Bermúdez 2013). The result is a fragmented speech in sentences with full sense, that even being independent of the speech have not lost the discursive framework they belong (to inherit metadata documentaries). This can feed the event-based knowledge systems, or be linked to deposits of open data, or published independently (vg. as tweets). As a result, the article offers an example of manual analysis that, in further research, will be automatic.
Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca; Argentina. Universidad Nacional del Sur. Departamento de Humanidades; Argentina
Fil: Abaitua Odriozola, Joseba K.. Universidad de Deusto; España
Fil: Carballal, David Buján. Universidad de Deusto; España
Fil: Díaz Labrador, José Luis. Universidad de Deusto; España
Fil: Bermúdez, Josu. Universidad de Deusto; España
description El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural, aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación
publishDate 2015
dc.date.none.fl_str_mv 2015-08
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/77832
Cantamutto, Lucía Marina; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu; Resolución de correferencias para la captura de eventos; Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica; Pilquen; 18; 2; 8-2015; 40-49
1851-3123
CONICET Digital
CONICET
url http://hdl.handle.net/11336/77832
identifier_str_mv Cantamutto, Lucía Marina; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu; Resolución de correferencias para la captura de eventos; Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica; Pilquen; 18; 2; 8-2015; 40-49
1851-3123
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://dialnet.unirioja.es/ejemplar/410971
info:eu-repo/semantics/altIdentifier/url/http://revele.uncoma.edu.ar/htdoc/revele/index.php/Sociales/article/view/1390
info:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/2c3cch
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica
publisher.none.fl_str_mv Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844614403558735872
score 13.070432