Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla

Autores
Vignolo, Leandro Daniel
Año de publicación
2012
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión aceptada
Colaborador/a o director/a de tesis
Rufiner, Hugo Leonardo
Ponzoni, Ignacio
Chiotti, Omar
Granitto, Pablo
Milone, Diego Humberto
Descripción
Fil: Vignolo, Leandro Daniel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
The key issue on speech recognition is given by the characteristics of the signals involved, as these are governed by complex probability density functions, are non-stationary and generally contaminated with noise of diverse nature and intensity. This is why the automatic recognition systems need a processing stage in order to bring out the key features of phonemes, allowing to improve their performance. The goal of this thesis is the development of a methodology for the optimization of the signal processing stage, in order to improve the results of an automatic speech recognition system. This methodology consists in the use of evolutionary algorithms for the optimization of the feature vector used for speech signal representation. The hypothesis is that the better the analysis or process applied to the patterns that are to be classified, the more separated would the classes result in the features space and, therefore, the classification task would be simpler. In this thesis, the first proposal is to continue the search for an optimal representation based on cepstral coefficients, by the optimization of the filterbank involved in this feature extraction procedure. On the other hand, wavelets have characteristics that are useful for the analysis of non-stationary signals. These features present discriminative information, however, the large number of coefficients makes the task of the classifier more difficult. Because of this, the use of an evolutionary algorithm is proposed to search for a subset of coefficients which maximizes the discrimination capability.
La dificultad para resolver los problemas asociados al reconocimiento del habla está dada por las características de las señales implicadas, ya que las mismas presentan complejas funciones de densidad de probabilidad, son no estacionarias y generalmente se encuentran contaminadas con ruidos de naturaleza e intensidad muy diversa. Es por ésto que los sistemas de reconocimiento automático requieren de una etapa de procesamiento que ponga en evidencia las características distintivas de cada fonema, permitiendo mejorar los resultados. El objetivo de esta tesis es el desarrollo de un método para optimizar la etapa de procesamiento de la señal de voz, de manera que permita mejorar los resultados de un sistema de reconocimiento automático del habla. Dicha metodología consiste en la aplicación de algoritmos evolutivos para optimizar el vector de características utilizado para representar las señales de voz. Se parte de la hipótesis de que cuanto mejor sea el análisis o proceso utilizado para generar los patrones a identificar, más separadas quedarán las clases en el espacio de características y la tarea de clasificación resultará más sencilla. Más precisamente, en esta tesis se proponen dos alternativas evolutivas para la búsqueda de un conjunto robusto de características. En la primera propuesta se aborda la optimización de una representación basada en coeficientes cepstrales. La segunda propuesta consiste en la optimización de una descomposición no convencional para el reconocimiento del habla, denominada paquetes de onditas, que provee características interesantes para el análisis de este tipo de señales.
Universidad Nacional del Litoral
Consejo Nacional de Investigaciones Científicas y Técnicas
Materia
Algoritmos evolutivos
Cuantización vectorial
Modelos ocultos de Markov
Paquete de onditas
Coeficientes cepstrales
Reconocimiento robusto del habla
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Repositorio
Biblioteca Virtual (UNL)
Institución
Universidad Nacional del Litoral
OAI Identificador
oai:https://bibliotecavirtual.unl.edu.ar:11185/307

id UNLBT_f5a3f3fb8fc6e7b596086641f7a0ad1b
oai_identifier_str oai:https://bibliotecavirtual.unl.edu.ar:11185/307
network_acronym_str UNLBT
repository_id_str 2187
network_name_str Biblioteca Virtual (UNL)
spelling Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del hablaEvolutionary optimization of signal representations for automatic speech recognitionVignolo, Leandro DanielAlgoritmos evolutivosCuantización vectorialModelos ocultos de MarkovPaquete de onditasCoeficientes cepstralesReconocimiento robusto del hablaFil: Vignolo, Leandro Daniel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.The key issue on speech recognition is given by the characteristics of the signals involved, as these are governed by complex probability density functions, are non-stationary and generally contaminated with noise of diverse nature and intensity. This is why the automatic recognition systems need a processing stage in order to bring out the key features of phonemes, allowing to improve their performance. The goal of this thesis is the development of a methodology for the optimization of the signal processing stage, in order to improve the results of an automatic speech recognition system. This methodology consists in the use of evolutionary algorithms for the optimization of the feature vector used for speech signal representation. The hypothesis is that the better the analysis or process applied to the patterns that are to be classified, the more separated would the classes result in the features space and, therefore, the classification task would be simpler. In this thesis, the first proposal is to continue the search for an optimal representation based on cepstral coefficients, by the optimization of the filterbank involved in this feature extraction procedure. On the other hand, wavelets have characteristics that are useful for the analysis of non-stationary signals. These features present discriminative information, however, the large number of coefficients makes the task of the classifier more difficult. Because of this, the use of an evolutionary algorithm is proposed to search for a subset of coefficients which maximizes the discrimination capability.La dificultad para resolver los problemas asociados al reconocimiento del habla está dada por las características de las señales implicadas, ya que las mismas presentan complejas funciones de densidad de probabilidad, son no estacionarias y generalmente se encuentran contaminadas con ruidos de naturaleza e intensidad muy diversa. Es por ésto que los sistemas de reconocimiento automático requieren de una etapa de procesamiento que ponga en evidencia las características distintivas de cada fonema, permitiendo mejorar los resultados. El objetivo de esta tesis es el desarrollo de un método para optimizar la etapa de procesamiento de la señal de voz, de manera que permita mejorar los resultados de un sistema de reconocimiento automático del habla. Dicha metodología consiste en la aplicación de algoritmos evolutivos para optimizar el vector de características utilizado para representar las señales de voz. Se parte de la hipótesis de que cuanto mejor sea el análisis o proceso utilizado para generar los patrones a identificar, más separadas quedarán las clases en el espacio de características y la tarea de clasificación resultará más sencilla. Más precisamente, en esta tesis se proponen dos alternativas evolutivas para la búsqueda de un conjunto robusto de características. En la primera propuesta se aborda la optimización de una representación basada en coeficientes cepstrales. La segunda propuesta consiste en la optimización de una descomposición no convencional para el reconocimiento del habla, denominada paquetes de onditas, que provee características interesantes para el análisis de este tipo de señales.Universidad Nacional del LitoralConsejo Nacional de Investigaciones Científicas y TécnicasRufiner, Hugo LeonardoPonzoni, IgnacioChiotti, OmarGranitto, PabloMilone, Diego Humberto2012-02-28T16:09:16Z2012-02-28info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionSNRDThesishttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfapplication/pdfhttp://hdl.handle.net/11185/307spaspainfo:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://creativecommons.org/licenses/by-nc-nd/4.0/deed.esreponame:Biblioteca Virtual (UNL)instname:Universidad Nacional del Litoralinstacron:UNL2025-09-29T14:30:02Zoai:https://bibliotecavirtual.unl.edu.ar:11185/307Institucionalhttp://bibliotecavirtual.unl.edu.ar/Universidad públicaNo correspondeajdeba@unl.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:21872025-09-29 14:30:03.217Biblioteca Virtual (UNL) - Universidad Nacional del Litoralfalse
dc.title.none.fl_str_mv Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
Evolutionary optimization of signal representations for automatic speech recognition
title Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
spellingShingle Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
Vignolo, Leandro Daniel
Algoritmos evolutivos
Cuantización vectorial
Modelos ocultos de Markov
Paquete de onditas
Coeficientes cepstrales
Reconocimiento robusto del habla
title_short Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
title_full Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
title_fullStr Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
title_full_unstemmed Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
title_sort Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla
dc.creator.none.fl_str_mv Vignolo, Leandro Daniel
author Vignolo, Leandro Daniel
author_facet Vignolo, Leandro Daniel
author_role author
dc.contributor.none.fl_str_mv Rufiner, Hugo Leonardo
Ponzoni, Ignacio
Chiotti, Omar
Granitto, Pablo
Milone, Diego Humberto
dc.subject.none.fl_str_mv Algoritmos evolutivos
Cuantización vectorial
Modelos ocultos de Markov
Paquete de onditas
Coeficientes cepstrales
Reconocimiento robusto del habla
topic Algoritmos evolutivos
Cuantización vectorial
Modelos ocultos de Markov
Paquete de onditas
Coeficientes cepstrales
Reconocimiento robusto del habla
dc.description.none.fl_txt_mv Fil: Vignolo, Leandro Daniel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
The key issue on speech recognition is given by the characteristics of the signals involved, as these are governed by complex probability density functions, are non-stationary and generally contaminated with noise of diverse nature and intensity. This is why the automatic recognition systems need a processing stage in order to bring out the key features of phonemes, allowing to improve their performance. The goal of this thesis is the development of a methodology for the optimization of the signal processing stage, in order to improve the results of an automatic speech recognition system. This methodology consists in the use of evolutionary algorithms for the optimization of the feature vector used for speech signal representation. The hypothesis is that the better the analysis or process applied to the patterns that are to be classified, the more separated would the classes result in the features space and, therefore, the classification task would be simpler. In this thesis, the first proposal is to continue the search for an optimal representation based on cepstral coefficients, by the optimization of the filterbank involved in this feature extraction procedure. On the other hand, wavelets have characteristics that are useful for the analysis of non-stationary signals. These features present discriminative information, however, the large number of coefficients makes the task of the classifier more difficult. Because of this, the use of an evolutionary algorithm is proposed to search for a subset of coefficients which maximizes the discrimination capability.
La dificultad para resolver los problemas asociados al reconocimiento del habla está dada por las características de las señales implicadas, ya que las mismas presentan complejas funciones de densidad de probabilidad, son no estacionarias y generalmente se encuentran contaminadas con ruidos de naturaleza e intensidad muy diversa. Es por ésto que los sistemas de reconocimiento automático requieren de una etapa de procesamiento que ponga en evidencia las características distintivas de cada fonema, permitiendo mejorar los resultados. El objetivo de esta tesis es el desarrollo de un método para optimizar la etapa de procesamiento de la señal de voz, de manera que permita mejorar los resultados de un sistema de reconocimiento automático del habla. Dicha metodología consiste en la aplicación de algoritmos evolutivos para optimizar el vector de características utilizado para representar las señales de voz. Se parte de la hipótesis de que cuanto mejor sea el análisis o proceso utilizado para generar los patrones a identificar, más separadas quedarán las clases en el espacio de características y la tarea de clasificación resultará más sencilla. Más precisamente, en esta tesis se proponen dos alternativas evolutivas para la búsqueda de un conjunto robusto de características. En la primera propuesta se aborda la optimización de una representación basada en coeficientes cepstrales. La segunda propuesta consiste en la optimización de una descomposición no convencional para el reconocimiento del habla, denominada paquetes de onditas, que provee características interesantes para el análisis de este tipo de señales.
Universidad Nacional del Litoral
Consejo Nacional de Investigaciones Científicas y Técnicas
description Fil: Vignolo, Leandro Daniel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
publishDate 2012
dc.date.none.fl_str_mv 2012-02-28T16:09:16Z
2012-02-28
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/acceptedVersion
SNRD
Thesis
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11185/307
url http://hdl.handle.net/11185/307
dc.language.none.fl_str_mv spa
spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Virtual (UNL)
instname:Universidad Nacional del Litoral
instacron:UNL
reponame_str Biblioteca Virtual (UNL)
collection Biblioteca Virtual (UNL)
instname_str Universidad Nacional del Litoral
instacron_str UNL
institution UNL
repository.name.fl_str_mv Biblioteca Virtual (UNL) - Universidad Nacional del Litoral
repository.mail.fl_str_mv jdeba@unl.edu.ar
_version_ 1844621936147038208
score 12.559606