Aprendizaje activo para clasificación de preguntas

Autores
Teruel, Milagro
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Alonso i Alemany, Laura
Luque, Franco Martín
Descripción
Quepy es una librería para construir sistema de respuesta a preguntas sobre datos enlazados, sin embargo utiliza patrones estáticos para reconocer preguntas y alcanzar una gran cobertura es muy costoso. Utilizamos un clasificador bayesiano ingenuo para clasificar reformulaciones de preguntas semánticamente equivalentes, ligarlas a una misma interpretación y aumentar esta cobertura. La falta de un corpus de preguntas etiquetado nos llevó a utilizar aprendizaje activo tanto sobre instancias como sobre características. En la representación de las instancias incluimos también las concordancias con los patrones parciales del Quepy, para capturar la información semántica de la pregunta. En este escenario contamos con muchas de preguntas que no concuerdan con ningún patrón y muchas clases minoritarias con pocos ejemplos cada una. Los resultados indican que balancear el corpus de entrenamiento utilizado por el clasificador evita que la clase mayoritaria se convierta en la única clase reconocida, mientras que el entrenamiento con características aumentó en gran medida el reconocimiento de las clases minoritarias.
Materia
Aprendizaje activo
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/2807

id RDUUNC_cc78025c86a22e02d6e57022f5c6e790
oai_identifier_str oai:rdu.unc.edu.ar:11086/2807
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Aprendizaje activo para clasificación de preguntasTeruel, MilagroAprendizaje activoQuepy es una librería para construir sistema de respuesta a preguntas sobre datos enlazados, sin embargo utiliza patrones estáticos para reconocer preguntas y alcanzar una gran cobertura es muy costoso. Utilizamos un clasificador bayesiano ingenuo para clasificar reformulaciones de preguntas semánticamente equivalentes, ligarlas a una misma interpretación y aumentar esta cobertura. La falta de un corpus de preguntas etiquetado nos llevó a utilizar aprendizaje activo tanto sobre instancias como sobre características. En la representación de las instancias incluimos también las concordancias con los patrones parciales del Quepy, para capturar la información semántica de la pregunta. En este escenario contamos con muchas de preguntas que no concuerdan con ningún patrón y muchas clases minoritarias con pocos ejemplos cada una. Los resultados indican que balancear el corpus de entrenamiento utilizado por el clasificador evita que la clase mayoritaria se convierta en la única clase reconocida, mientras que el entrenamiento con características aumentó en gran medida el reconocimiento de las clases minoritarias.Alonso i Alemany, LauraLuque, Franco Martín2015info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/2807spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:44:00Zoai:rdu.unc.edu.ar:11086/2807Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:44:00.773Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Aprendizaje activo para clasificación de preguntas
title Aprendizaje activo para clasificación de preguntas
spellingShingle Aprendizaje activo para clasificación de preguntas
Teruel, Milagro
Aprendizaje activo
title_short Aprendizaje activo para clasificación de preguntas
title_full Aprendizaje activo para clasificación de preguntas
title_fullStr Aprendizaje activo para clasificación de preguntas
title_full_unstemmed Aprendizaje activo para clasificación de preguntas
title_sort Aprendizaje activo para clasificación de preguntas
dc.creator.none.fl_str_mv Teruel, Milagro
author Teruel, Milagro
author_facet Teruel, Milagro
author_role author
dc.contributor.none.fl_str_mv Alonso i Alemany, Laura
Luque, Franco Martín
dc.subject.none.fl_str_mv Aprendizaje activo
topic Aprendizaje activo
dc.description.none.fl_txt_mv Quepy es una librería para construir sistema de respuesta a preguntas sobre datos enlazados, sin embargo utiliza patrones estáticos para reconocer preguntas y alcanzar una gran cobertura es muy costoso. Utilizamos un clasificador bayesiano ingenuo para clasificar reformulaciones de preguntas semánticamente equivalentes, ligarlas a una misma interpretación y aumentar esta cobertura. La falta de un corpus de preguntas etiquetado nos llevó a utilizar aprendizaje activo tanto sobre instancias como sobre características. En la representación de las instancias incluimos también las concordancias con los patrones parciales del Quepy, para capturar la información semántica de la pregunta. En este escenario contamos con muchas de preguntas que no concuerdan con ningún patrón y muchas clases minoritarias con pocos ejemplos cada una. Los resultados indican que balancear el corpus de entrenamiento utilizado por el clasificador evita que la clase mayoritaria se convierta en la única clase reconocida, mientras que el entrenamiento con características aumentó en gran medida el reconocimiento de las clases minoritarias.
description Quepy es una librería para construir sistema de respuesta a preguntas sobre datos enlazados, sin embargo utiliza patrones estáticos para reconocer preguntas y alcanzar una gran cobertura es muy costoso. Utilizamos un clasificador bayesiano ingenuo para clasificar reformulaciones de preguntas semánticamente equivalentes, ligarlas a una misma interpretación y aumentar esta cobertura. La falta de un corpus de preguntas etiquetado nos llevó a utilizar aprendizaje activo tanto sobre instancias como sobre características. En la representación de las instancias incluimos también las concordancias con los patrones parciales del Quepy, para capturar la información semántica de la pregunta. En este escenario contamos con muchas de preguntas que no concuerdan con ningún patrón y muchas clases minoritarias con pocos ejemplos cada una. Los resultados indican que balancear el corpus de entrenamiento utilizado por el clasificador evita que la clase mayoritaria se convierta en la única clase reconocida, mientras que el entrenamiento con características aumentó en gran medida el reconocimiento de las clases minoritarias.
publishDate 2015
dc.date.none.fl_str_mv 2015
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/2807
url http://hdl.handle.net/11086/2807
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618971516502016
score 13.070432