Reconocedor de habla continua independiente del contexto para el español de Argentina

Autores
Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis
Año de publicación
2009
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%.
This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a silence model). The acoustical database included 741 sentences with 2837 different words –97% of Spanish syllables– recorded at an acoustic chamber by two professional announcers. The optimal values of the recognizer parameters were selected in order to maximize the recognition rate and simultaneously to reduce the execution time. The optimal average accuracy (%Acc) obtained, using 10-fold cross validation method, was 97.87% with a Real-Time Rate (%RT) of 34.98%.
Fil: Univaso, Pedro Nicolas. Universidad Austral. Facultad de Ingeniería; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
Fil: Gurlekian, Jorge Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
Fil: Evin, Diego Alexis. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
Materia
Reconocimiento Automático de Habla
Español de Argentina
Tasa de Tiempo Real
Modelos Ocultos de Markov
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/113289

id CONICETDig_6121169933e32442ab802012b4594559
oai_identifier_str oai:ri.conicet.gov.ar:11336/113289
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Reconocedor de habla continua independiente del contexto para el español de ArgentinaUnivaso, Pedro NicolasGurlekian, Jorge AlbertoEvin, Diego AlexisReconocimiento Automático de HablaEspañol de ArgentinaTasa de Tiempo RealModelos Ocultos de Markovhttps://purl.org/becyt/ford/1.2https://purl.org/becyt/ford/1En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%.This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a silence model). The acoustical database included 741 sentences with 2837 different words –97% of Spanish syllables– recorded at an acoustic chamber by two professional announcers. The optimal values of the recognizer parameters were selected in order to maximize the recognition rate and simultaneously to reduce the execution time. The optimal average accuracy (%Acc) obtained, using 10-fold cross validation method, was 97.87% with a Real-Time Rate (%RT) of 34.98%.Fil: Univaso, Pedro Nicolas. Universidad Austral. Facultad de Ingeniería; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; ArgentinaFil: Gurlekian, Jorge Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; ArgentinaFil: Evin, Diego Alexis. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; ArgentinaUniversidad Autónoma de Colombia2009-07info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/113289Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis; Reconocedor de habla continua independiente del contexto para el español de Argentina; Universidad Autónoma de Colombia; Clepsidra; 5; 8; 7-2009; 13-221900-1355CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/doi/10.26564/19001355.273info:eu-repo/semantics/altIdentifier/url/http://revistas.fuac.edu.co/index.php/clepsidra/article/view/273info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T10:10:40Zoai:ri.conicet.gov.ar:11336/113289instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 10:10:40.559CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Reconocedor de habla continua independiente del contexto para el español de Argentina
title Reconocedor de habla continua independiente del contexto para el español de Argentina
spellingShingle Reconocedor de habla continua independiente del contexto para el español de Argentina
Univaso, Pedro Nicolas
Reconocimiento Automático de Habla
Español de Argentina
Tasa de Tiempo Real
Modelos Ocultos de Markov
title_short Reconocedor de habla continua independiente del contexto para el español de Argentina
title_full Reconocedor de habla continua independiente del contexto para el español de Argentina
title_fullStr Reconocedor de habla continua independiente del contexto para el español de Argentina
title_full_unstemmed Reconocedor de habla continua independiente del contexto para el español de Argentina
title_sort Reconocedor de habla continua independiente del contexto para el español de Argentina
dc.creator.none.fl_str_mv Univaso, Pedro Nicolas
Gurlekian, Jorge Alberto
Evin, Diego Alexis
author Univaso, Pedro Nicolas
author_facet Univaso, Pedro Nicolas
Gurlekian, Jorge Alberto
Evin, Diego Alexis
author_role author
author2 Gurlekian, Jorge Alberto
Evin, Diego Alexis
author2_role author
author
dc.subject.none.fl_str_mv Reconocimiento Automático de Habla
Español de Argentina
Tasa de Tiempo Real
Modelos Ocultos de Markov
topic Reconocimiento Automático de Habla
Español de Argentina
Tasa de Tiempo Real
Modelos Ocultos de Markov
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.2
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%.
This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a silence model). The acoustical database included 741 sentences with 2837 different words –97% of Spanish syllables– recorded at an acoustic chamber by two professional announcers. The optimal values of the recognizer parameters were selected in order to maximize the recognition rate and simultaneously to reduce the execution time. The optimal average accuracy (%Acc) obtained, using 10-fold cross validation method, was 97.87% with a Real-Time Rate (%RT) of 34.98%.
Fil: Univaso, Pedro Nicolas. Universidad Austral. Facultad de Ingeniería; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
Fil: Gurlekian, Jorge Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
Fil: Evin, Diego Alexis. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Inmunología, Genética y Metabolismo. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Inmunología, Genética y Metabolismo; Argentina
description En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%.
publishDate 2009
dc.date.none.fl_str_mv 2009-07
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/113289
Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis; Reconocedor de habla continua independiente del contexto para el español de Argentina; Universidad Autónoma de Colombia; Clepsidra; 5; 8; 7-2009; 13-22
1900-1355
CONICET Digital
CONICET
url http://hdl.handle.net/11336/113289
identifier_str_mv Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis; Reconocedor de habla continua independiente del contexto para el español de Argentina; Universidad Autónoma de Colombia; Clepsidra; 5; 8; 7-2009; 13-22
1900-1355
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/doi/10.26564/19001355.273
info:eu-repo/semantics/altIdentifier/url/http://revistas.fuac.edu.co/index.php/clepsidra/article/view/273
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Autónoma de Colombia
publisher.none.fl_str_mv Universidad Autónoma de Colombia
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844613997906624512
score 13.070432