Keyword spotting en idiomas sin datos

Autores
Brusco, Pablo Daniel
Año de publicación
2014
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Gravano, Agustín
Descripción
En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.
Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
DETECCION DE PALABRAS CLAVES
KEYWORD SPOTTING
SPEECH RECOGNITION
FILLERS
MODELOS OCULTOS DE MARKOV
WORD SPOTTING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000705_Brusco

id BDUBAFCEN_1687993fd416ad30ae24380924452c3d
oai_identifier_str seminario:seminario_nCOM000705_Brusco
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Keyword spotting en idiomas sin datosBrusco, Pablo DanielDETECCION DE PALABRAS CLAVESKEYWORD SPOTTINGSPEECH RECOGNITIONFILLERSMODELOS OCULTOS DE MARKOVWORD SPOTTINGEn este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesGravano, Agustín2014info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000705_Bruscospainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-18T10:09:57Zseminario:seminario_nCOM000705_BruscoInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-18 10:09:58.612Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Keyword spotting en idiomas sin datos
title Keyword spotting en idiomas sin datos
spellingShingle Keyword spotting en idiomas sin datos
Brusco, Pablo Daniel
DETECCION DE PALABRAS CLAVES
KEYWORD SPOTTING
SPEECH RECOGNITION
FILLERS
MODELOS OCULTOS DE MARKOV
WORD SPOTTING
title_short Keyword spotting en idiomas sin datos
title_full Keyword spotting en idiomas sin datos
title_fullStr Keyword spotting en idiomas sin datos
title_full_unstemmed Keyword spotting en idiomas sin datos
title_sort Keyword spotting en idiomas sin datos
dc.creator.none.fl_str_mv Brusco, Pablo Daniel
author Brusco, Pablo Daniel
author_facet Brusco, Pablo Daniel
author_role author
dc.contributor.none.fl_str_mv Gravano, Agustín
dc.subject.none.fl_str_mv DETECCION DE PALABRAS CLAVES
KEYWORD SPOTTING
SPEECH RECOGNITION
FILLERS
MODELOS OCULTOS DE MARKOV
WORD SPOTTING
topic DETECCION DE PALABRAS CLAVES
KEYWORD SPOTTING
SPEECH RECOGNITION
FILLERS
MODELOS OCULTOS DE MARKOV
WORD SPOTTING
dc.description.none.fl_txt_mv En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.
Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.
publishDate 2014
dc.date.none.fl_str_mv 2014
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco
url https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1843608749133004800
score 13.001348