Question answering de dominio abierto y de dominio cerrado

Autores: Peller, Julián
Año de publicación: 2016
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Castaño, José Manuel
Descripción: Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.
Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia: QUESTION ANSWERING
CLOSED DOMAIN
OPEN DOMAIN
MULTILINGUAL
FREELING
QANUS
CLEF
SEMANTIC TRACTABILITY
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Institución: Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador: seminario:seminario_nCOM000662_Peller

Acceder

id	BDUBAFCEN_04c8eb708d335d16d732395431e50a4d
oai_identifier_str	seminario:seminario_nCOM000662_Peller
network_acronym_str	BDUBAFCEN
repository_id_str	1896
network_name_str	Biblioteca Digital (UBA-FCEN)
spelling	Question answering de dominio abierto y de dominio cerradoOpen and closed domain question answeringPeller, JuliánQUESTION ANSWERINGCLOSED DOMAINOPEN DOMAINMULTILINGUALFREELINGQANUSCLEFSEMANTIC TRACTABILITYQuestion answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling.Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Manuel2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000662_Pellerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-05-07T11:48:10Zseminario:seminario_nCOM000662_PellerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-05-07 11:48:13.922Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv	Question answering de dominio abierto y de dominio cerrado Open and closed domain question answering
title	Question answering de dominio abierto y de dominio cerrado
spellingShingle	Question answering de dominio abierto y de dominio cerrado Peller, Julián QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY
title_short	Question answering de dominio abierto y de dominio cerrado
title_full	Question answering de dominio abierto y de dominio cerrado
title_fullStr	Question answering de dominio abierto y de dominio cerrado
title_full_unstemmed	Question answering de dominio abierto y de dominio cerrado
title_sort	Question answering de dominio abierto y de dominio cerrado
dc.creator.none.fl_str_mv	Peller, Julián
author	Peller, Julián
author_facet	Peller, Julián
author_role	author
dc.contributor.none.fl_str_mv	Castaño, José Manuel
dc.subject.none.fl_str_mv	QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY
topic	QUESTION ANSWERING CLOSED DOMAIN OPEN DOMAIN MULTILINGUAL FREELING QANUS CLEF SEMANTIC TRACTABILITY
dc.description.none.fl_txt_mv	Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling. Question answering is a computer science area that aims to generate concrete responses to questions posed in some natural language. It's a complex area that combines information retrieval, natural language processing and information extraction tools. For example, for the input `When was Noam Chomsky born?, a question answer system should return something like December 7th, 1928 . This area represents a logical step beyond the standard information retrieval systems and in recent years it has achieved a series of important milestones, driven by the general project of semantic web. Watson, the system developed by IBM which defeated the best human competitors of Jeopardy, is the most visible example, but even search engines like Bing and Google have started to incorporate this kind of algorithm. In this thesis we research the different problems subsumed under the concept of question answering and we review different solutions and models applied to resolve them, under the project of the implementation of two basic systems of question answering. The first implemented system is a closed (specific) domain model with structured data only for English. The second model is an open domain multilingual system which is used as corpora wikipedias in different languages. For the first model we oriented our development following the theoretical framework exposed in the paper [Popescu et al., 2003a] and we implemented solutions for a restricted set of questions. For the second model, we used a subset of problems of the competition CLEF '07 and we developed the system using as baseline the framework Qanus, adapting it to use the multilingual natural language processing tools of the library Freeling. Fil: Peller, Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description	Question answering es un área de ciencias de la computación que busca generar respuestas concretas a preguntas expresadas en algún lenguaje natural. Es un área compleja que combina herramientas de búsqueda y recuperación de la información (information retrieval), de procesamiento del lenguaje natural (nlp) y de extracción de información (information extraction). Por poner un ejemplo: para el input ¾ Cuándo nació Noam Chomsky? un sistema de question answering debería devolver algo como el 7 de diciembre de 1928 . Esta área representa el paso lógico posterior a los sistemas de recuperación de documentos y logró en los último años una serie de hitos impulsados por el proyecto general de la web semántica. Watson, el sistema desarrollado por IBM que derrotó a los mejores competidores de Jeropardy es el ejemplo más visible, pero incluso buscadores como Bing y Google comienzan a incorporar este tipo de algoritmia. En esta tesis investigamos los distintos problemas que se subsumen bajo el concepto de question answering y reseñamos diferentes soluciones y modelos aplicados para resolverlos, bajo el proyecto de la implementación de dos sistemas básicos de question answering. El primer sistema implementado es un modelo de dominio cerrado (específico) y datos estructurados solo para inglés. El segundo modelo es un sistema multilingüe, de dominio abierto y que utiliza como corpora las wikipedias de diferentes idiomas. Para el primer modelo orientamos nuestro desarrollo de acuerdo al modelo teórico del paper [Popescu et al., 2003a] e implementamos soluciones para un conjunto restringido de preguntas. Para el segundo modelo utilizamos un subconjunto de los problemas de la competencia CLEF '07 y desarrollamos el sistema utilizando como baseline el framework Qanun, adaptándolo para utilizar herramientas de procesamiento de lenguaje multilingües de la librería Freeling.
publishDate	2016
dc.date.none.fl_str_mv	2016
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
url	https://hdl.handle.net/20.500.12110/seminario_nCOM000662_Peller
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv	reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN
reponame_str	Biblioteca Digital (UBA-FCEN)
collection	Biblioteca Digital (UBA-FCEN)
instname_str	Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str	UBA-FCEN
institution	UBA-FCEN
repository.name.fl_str_mv	Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv	ana@bl.fcen.uba.ar
_version_	1864545661930700800
score	12.637756

Question answering de dominio abierto y de dominio cerrado

Publicaciones similares