Question answering de dominio abierto y de dominio cerrado

Autores
Peller, Julián
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Castaño, José Manuel
Descripción
Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.
Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000662_Peller

id BDUBAFCEN_04c8eb708d335d16d732395431e50a4d
oai_identifier_str seminario:seminario_nCOM000662_Peller
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Question answering de dominio abierto y de dominio cerradoOpen and closed domain question answeringPeller, JuliánQUESTION ANSWERINGCLOSED DOMAINOPEN DOMAINMULTILINGUALFREELINGQANUSCLEFSEMANTIC TRACTABILITYQuestion answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Manuel2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000662_Pellerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:40Zseminario:seminario_nCOM000662_PellerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:41.619Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Question answering de dominio abierto y de dominio cerrado
Open and closed domain question answering
title Question answering de dominio abierto y de dominio cerrado
spellingShingle Question answering de dominio abierto y de dominio cerrado
Peller, Julián
QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY
title_short Question answering de dominio abierto y de dominio cerrado
title_full Question answering de dominio abierto y de dominio cerrado
title_fullStr Question answering de dominio abierto y de dominio cerrado
title_full_unstemmed Question answering de dominio abierto y de dominio cerrado
title_sort Question answering de dominio abierto y de dominio cerrado
dc.creator.none.fl_str_mv Peller, Julián
author Peller, Julián
author_facet Peller, Julián
author_role author
dc.contributor.none.fl_str_mv Castaño, José Manuel
dc.subject.none.fl_str_mv QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY
topic QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY
dc.description.none.fl_txt_mv Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.
Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
publishDate 2016
dc.date.none.fl_str_mv 2016
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
url https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618757518917632
score 13.070432