Keyword spotting en idiomas sin datos
- Autores
- Brusco, Pablo Daniel
- Año de publicación
- 2014
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Gravano, Agustín
- Descripción
- En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.
Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
DETECCION DE PALABRAS CLAVES
KEYWORD SPOTTING
SPEECH RECOGNITION
FILLERS
MODELOS OCULTOS DE MARKOV
WORD SPOTTING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000705_Brusco
Ver los metadatos del registro completo
id |
BDUBAFCEN_1687993fd416ad30ae24380924452c3d |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000705_Brusco |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Keyword spotting en idiomas sin datosBrusco, Pablo DanielDETECCION DE PALABRAS CLAVESKEYWORD SPOTTINGSPEECH RECOGNITIONFILLERSMODELOS OCULTOS DE MARKOVWORD SPOTTINGEn este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo.Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesGravano, Agustín2014info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000705_Bruscospainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-18T10:09:57Zseminario:seminario_nCOM000705_BruscoInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-18 10:09:58.612Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Keyword spotting en idiomas sin datos |
title |
Keyword spotting en idiomas sin datos |
spellingShingle |
Keyword spotting en idiomas sin datos Brusco, Pablo Daniel DETECCION DE PALABRAS CLAVES KEYWORD SPOTTING SPEECH RECOGNITION FILLERS MODELOS OCULTOS DE MARKOV WORD SPOTTING |
title_short |
Keyword spotting en idiomas sin datos |
title_full |
Keyword spotting en idiomas sin datos |
title_fullStr |
Keyword spotting en idiomas sin datos |
title_full_unstemmed |
Keyword spotting en idiomas sin datos |
title_sort |
Keyword spotting en idiomas sin datos |
dc.creator.none.fl_str_mv |
Brusco, Pablo Daniel |
author |
Brusco, Pablo Daniel |
author_facet |
Brusco, Pablo Daniel |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gravano, Agustín |
dc.subject.none.fl_str_mv |
DETECCION DE PALABRAS CLAVES KEYWORD SPOTTING SPEECH RECOGNITION FILLERS MODELOS OCULTOS DE MARKOV WORD SPOTTING |
topic |
DETECCION DE PALABRAS CLAVES KEYWORD SPOTTING SPEECH RECOGNITION FILLERS MODELOS OCULTOS DE MARKOV WORD SPOTTING |
dc.description.none.fl_txt_mv |
En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo. Fil: Brusco, Pablo Daniel. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En este trabajo se propone estudiar el problema llamado detección de palabras claves (keyword-spotting en inglés) en el contexto de idiomas que no disponen de corpus de datos con grabaciones y transcripciones temporales o fonéticas. El desarrollo y experimentación han sido realizados utilizando el Boston University Radio Speech Corpus, una base de datos de grabaciones tomadas de una radio en Massachusetts. Se analiza el uso de modelos ocultos de Markov (HMMs) para la detección de palabras sobre habla continua estudiando diversas topologías y parametrizaciones. Los modelos se basan en el uso de “fillers” para palabras no buscadas y palabras completas o fonemas como unidades mínimas de detección. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 78.9 falsas alarmas por hora. Para las pruebas, se utilizó un conjunto de 20 keywords entrenadas con 14 minutos de datos transcritos y fillers entrenados con 7 horas sin transcripciones. Los resultados se muestran en base a 1.9 horas de datos para testeo. |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000705_Brusco |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1843608749133004800 |
score |
13.001348 |