Predicción de la respuesta en un sistema de búsqueda de respuesta semántico

Autores
Oyarzun, Matías; Roger, Sandra
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, literal, boolean) a la que pertenecen. Para el entrenamiento, se utilizaron los datasets de DBPedia y Wikidata de los SMART 2020 y 2021. En este prototipo, se entrenaron 4 modelos de aprendizaje automático con distintas combinaciones de los datasets para hallar el más preciso. El mejor modelo, obtuvo una precisión del 97, 2% y 96,8% para los datasets de DBpedia y Wikidata, respectivamente. En ambos casos, se utilizó el clasificador Support-Vector Machines (SVM). Posteriormente, se busca también la construcción de un modelo para la tarea de Predicción del Tipo de Respuesta. Esto permitirá, finalmente, la implementación de un Sistema de Búsqueda de Respuestas eficiente.
Short Paper - Alumnos
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
clasificación de preguntas
aprendizaje automático
SMART
Question Answering
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/149629

id SEDICI_73f324c4351c053113f58790ba5b2c18
oai_identifier_str oai:sedici.unlp.edu.ar:10915/149629
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Predicción de la respuesta en un sistema de búsqueda de respuesta semánticoOyarzun, MatíasRoger, SandraCiencias Informáticasclasificación de preguntasaprendizaje automáticoSMARTQuestion AnsweringEn este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, literal, boolean) a la que pertenecen. Para el entrenamiento, se utilizaron los datasets de DBPedia y Wikidata de los SMART 2020 y 2021. En este prototipo, se entrenaron 4 modelos de aprendizaje automático con distintas combinaciones de los datasets para hallar el más preciso. El mejor modelo, obtuvo una precisión del 97, 2% y 96,8% para los datasets de DBpedia y Wikidata, respectivamente. En ambos casos, se utilizó el clasificador Support-Vector Machines (SVM). Posteriormente, se busca también la construcción de un modelo para la tarea de Predicción del Tipo de Respuesta. Esto permitirá, finalmente, la implementación de un Sistema de Búsqueda de Respuestas eficiente.Short Paper - AlumnosRed de Universidades con Carreras en Informática2022-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf962-966http://sedici.unlp.edu.ar/handle/10915/149629spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-1364-31-2info:eu-repo/semantics/reference/hdl/10915/149102info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T11:10:26Zoai:sedici.unlp.edu.ar:10915/149629Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 11:10:26.232SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
title Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
spellingShingle Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
Oyarzun, Matías
Ciencias Informáticas
clasificación de preguntas
aprendizaje automático
SMART
Question Answering
title_short Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
title_full Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
title_fullStr Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
title_full_unstemmed Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
title_sort Predicción de la respuesta en un sistema de búsqueda de respuesta semántico
dc.creator.none.fl_str_mv Oyarzun, Matías
Roger, Sandra
author Oyarzun, Matías
author_facet Oyarzun, Matías
Roger, Sandra
author_role author
author2 Roger, Sandra
author2_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
clasificación de preguntas
aprendizaje automático
SMART
Question Answering
topic Ciencias Informáticas
clasificación de preguntas
aprendizaje automático
SMART
Question Answering
dc.description.none.fl_txt_mv En este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, literal, boolean) a la que pertenecen. Para el entrenamiento, se utilizaron los datasets de DBPedia y Wikidata de los SMART 2020 y 2021. En este prototipo, se entrenaron 4 modelos de aprendizaje automático con distintas combinaciones de los datasets para hallar el más preciso. El mejor modelo, obtuvo una precisión del 97, 2% y 96,8% para los datasets de DBpedia y Wikidata, respectivamente. En ambos casos, se utilizó el clasificador Support-Vector Machines (SVM). Posteriormente, se busca también la construcción de un modelo para la tarea de Predicción del Tipo de Respuesta. Esto permitirá, finalmente, la implementación de un Sistema de Búsqueda de Respuestas eficiente.
Short Paper - Alumnos
Red de Universidades con Carreras en Informática
description En este articulo se describe un primer prototipo que se ha desarrollado para la tarea de Predicción de la Categoría planteada en el desafío SMART. Este problema se puede plantear como una tarea de clasificación multiclase, pues toma preguntas en lenguaje natural y devuelve la categoría (resource, literal, boolean) a la que pertenecen. Para el entrenamiento, se utilizaron los datasets de DBPedia y Wikidata de los SMART 2020 y 2021. En este prototipo, se entrenaron 4 modelos de aprendizaje automático con distintas combinaciones de los datasets para hallar el más preciso. El mejor modelo, obtuvo una precisión del 97, 2% y 96,8% para los datasets de DBpedia y Wikidata, respectivamente. En ambos casos, se utilizó el clasificador Support-Vector Machines (SVM). Posteriormente, se busca también la construcción de un modelo para la tarea de Predicción del Tipo de Respuesta. Esto permitirá, finalmente, la implementación de un Sistema de Búsqueda de Respuestas eficiente.
publishDate 2022
dc.date.none.fl_str_mv 2022-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/149629
url http://sedici.unlp.edu.ar/handle/10915/149629
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-1364-31-2
info:eu-repo/semantics/reference/hdl/10915/149102
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
962-966
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260608338100224
score 13.13397