Question answering de dominio abierto y de dominio cerrado
- Autores
- Peller, Julián
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Castaño, José Manuel
- Descripción
- Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.
Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000662_Peller
Ver los metadatos del registro completo
id |
BDUBAFCEN_04c8eb708d335d16d732395431e50a4d |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000662_Peller |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Question answering de dominio abierto y de dominio cerradoOpen and closed domain question answeringPeller, JuliánQUESTION ANSWERINGCLOSED DOMAINOPEN DOMAINMULTILINGUALFREELINGQANUSCLEFSEMANTIC TRACTABILITYQuestion answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Manuel2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000662_Pellerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:40Zseminario:seminario_nCOM000662_PellerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:41.619Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Question answering de dominio abierto y de dominio cerrado Open and closed domain question answering |
title |
Question answering de dominio abierto y de dominio cerrado |
spellingShingle |
Question answering de dominio abierto y de dominio cerrado Peller, Julián QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY |
title_short |
Question answering de dominio abierto y de dominio cerrado |
title_full |
Question answering de dominio abierto y de dominio cerrado |
title_fullStr |
Question answering de dominio abierto y de dominio cerrado |
title_full_unstemmed |
Question answering de dominio abierto y de dominio cerrado |
title_sort |
Question answering de dominio abierto y de dominio cerrado |
dc.creator.none.fl_str_mv |
Peller, Julián |
author |
Peller, Julián |
author_facet |
Peller, Julián |
author_role |
author |
dc.contributor.none.fl_str_mv |
Castaño, José Manuel |
dc.subject.none.fl_str_mv |
QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY |
topic |
QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY |
dc.description.none.fl_txt_mv |
Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling. Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling. Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618757518917632 |
score |
13.070432 |