Automatic Classification of Sustained Vowels Based on Signal Regularity Measures

Autores
Miramont, Juan Manuel; Schlotthauer, Gaston
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
En el año 1995 Ingo Titze propuso un sistema de clasificación de fonemas vocálicos en tres tipos (Tipo I,Tipo II y Tipo III) en base a la regularidad de la señal de voz cuasiperiódica correspondiente. En la práctica clı́nica fonoaudiológica, esta clasificación se realiza en base a la inspección visual de espectrogramas, no siendo claros los criterios que diferencian un tipo de voz de otra, especialmente entre los tipos I y II. En consecuencia, existe una granvariación interprofesional y una fuerte dependencia de la experiencia de cada especialista. Con el fin de lograr una clasificación objetiva basada en parámetros cuantitativos, se buscó extraer caracterı́sticas capaces de representar las diferencias fundamentales entre las voces de Tipos I y II, para luego clasificar una base de datos anotada. Se extrajeron parámetros acústicos clásicos, como medidas de Jitter y Shimmer, y harmonics to noise ratio (HNR) calculados utilizando PRAAT. También se propuso la utilización de la amplitud del primer ramónico (R1) y dos caracterı́sticas ideadas porlos autores de este trabajo: varianza normalizada de la primera componente principal (VNCP) y razones pico-valle (PV) espectrales. La clasificación se realizó mediante máquinas de soporte vectorial (SVM) de kernel lineal utilizando las caracterı́sticas que minimizan el error del clasificador. Como resultado, se obtuvo un error de validación cruzada de 11.61%, con porcentajes de acierto del 93.24% y 83.95%, para voces Tipo I y Tipo II respectivamente.
Fil: Miramont, Juan Manuel. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; Argentina
Fil: Schlotthauer, Gaston. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; Argentina
Materia
Tipos de voces
Clasificación de vocales sostenidas
Procesamiento de la señal de voz
Máquinas de soporte vectorial
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/107373

id CONICETDig_db0306bf5eb52ae5a88a02407f3626b5
oai_identifier_str oai:ri.conicet.gov.ar:11336/107373
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Automatic Classification of Sustained Vowels Based on Signal Regularity MeasuresMiramont, Juan ManuelSchlotthauer, GastonTipos de vocesClasificación de vocales sostenidasProcesamiento de la señal de vozMáquinas de soporte vectorialhttps://purl.org/becyt/ford/2.11https://purl.org/becyt/ford/2En el año 1995 Ingo Titze propuso un sistema de clasificación de fonemas vocálicos en tres tipos (Tipo I,Tipo II y Tipo III) en base a la regularidad de la señal de voz cuasiperiódica correspondiente. En la práctica clı́nica fonoaudiológica, esta clasificación se realiza en base a la inspección visual de espectrogramas, no siendo claros los criterios que diferencian un tipo de voz de otra, especialmente entre los tipos I y II. En consecuencia, existe una granvariación interprofesional y una fuerte dependencia de la experiencia de cada especialista. Con el fin de lograr una clasificación objetiva basada en parámetros cuantitativos, se buscó extraer caracterı́sticas capaces de representar las diferencias fundamentales entre las voces de Tipos I y II, para luego clasificar una base de datos anotada. Se extrajeron parámetros acústicos clásicos, como medidas de Jitter y Shimmer, y harmonics to noise ratio (HNR) calculados utilizando PRAAT. También se propuso la utilización de la amplitud del primer ramónico (R1) y dos caracterı́sticas ideadas porlos autores de este trabajo: varianza normalizada de la primera componente principal (VNCP) y razones pico-valle (PV) espectrales. La clasificación se realizó mediante máquinas de soporte vectorial (SVM) de kernel lineal utilizando las caracterı́sticas que minimizan el error del clasificador. Como resultado, se obtuvo un error de validación cruzada de 11.61%, con porcentajes de acierto del 93.24% y 83.95%, para voces Tipo I y Tipo II respectivamente.Fil: Miramont, Juan Manuel. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; ArgentinaFil: Schlotthauer, Gaston. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; ArgentinaSociedad Argentina de Bioingeniería2019-03info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/107373Miramont, Juan Manuel; Schlotthauer, Gaston; Automatic Classification of Sustained Vowels Based on Signal Regularity Measures; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 23; 1; 3-2019; 55-622591-376XCONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://revista.sabi.org.ar/index.php/revista/issue/view/14info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-10-22T12:14:38Zoai:ri.conicet.gov.ar:11336/107373instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-10-22 12:14:39.19CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
title Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
spellingShingle Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
Miramont, Juan Manuel
Tipos de voces
Clasificación de vocales sostenidas
Procesamiento de la señal de voz
Máquinas de soporte vectorial
title_short Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
title_full Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
title_fullStr Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
title_full_unstemmed Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
title_sort Automatic Classification of Sustained Vowels Based on Signal Regularity Measures
dc.creator.none.fl_str_mv Miramont, Juan Manuel
Schlotthauer, Gaston
author Miramont, Juan Manuel
author_facet Miramont, Juan Manuel
Schlotthauer, Gaston
author_role author
author2 Schlotthauer, Gaston
author2_role author
dc.subject.none.fl_str_mv Tipos de voces
Clasificación de vocales sostenidas
Procesamiento de la señal de voz
Máquinas de soporte vectorial
topic Tipos de voces
Clasificación de vocales sostenidas
Procesamiento de la señal de voz
Máquinas de soporte vectorial
purl_subject.fl_str_mv https://purl.org/becyt/ford/2.11
https://purl.org/becyt/ford/2
dc.description.none.fl_txt_mv En el año 1995 Ingo Titze propuso un sistema de clasificación de fonemas vocálicos en tres tipos (Tipo I,Tipo II y Tipo III) en base a la regularidad de la señal de voz cuasiperiódica correspondiente. En la práctica clı́nica fonoaudiológica, esta clasificación se realiza en base a la inspección visual de espectrogramas, no siendo claros los criterios que diferencian un tipo de voz de otra, especialmente entre los tipos I y II. En consecuencia, existe una granvariación interprofesional y una fuerte dependencia de la experiencia de cada especialista. Con el fin de lograr una clasificación objetiva basada en parámetros cuantitativos, se buscó extraer caracterı́sticas capaces de representar las diferencias fundamentales entre las voces de Tipos I y II, para luego clasificar una base de datos anotada. Se extrajeron parámetros acústicos clásicos, como medidas de Jitter y Shimmer, y harmonics to noise ratio (HNR) calculados utilizando PRAAT. También se propuso la utilización de la amplitud del primer ramónico (R1) y dos caracterı́sticas ideadas porlos autores de este trabajo: varianza normalizada de la primera componente principal (VNCP) y razones pico-valle (PV) espectrales. La clasificación se realizó mediante máquinas de soporte vectorial (SVM) de kernel lineal utilizando las caracterı́sticas que minimizan el error del clasificador. Como resultado, se obtuvo un error de validación cruzada de 11.61%, con porcentajes de acierto del 93.24% y 83.95%, para voces Tipo I y Tipo II respectivamente.
Fil: Miramont, Juan Manuel. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; Argentina
Fil: Schlotthauer, Gaston. Universidad Nacional de Entre Ríos. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática - Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación y Desarrollo en Bioingeniería y Bioinformática; Argentina
description En el año 1995 Ingo Titze propuso un sistema de clasificación de fonemas vocálicos en tres tipos (Tipo I,Tipo II y Tipo III) en base a la regularidad de la señal de voz cuasiperiódica correspondiente. En la práctica clı́nica fonoaudiológica, esta clasificación se realiza en base a la inspección visual de espectrogramas, no siendo claros los criterios que diferencian un tipo de voz de otra, especialmente entre los tipos I y II. En consecuencia, existe una granvariación interprofesional y una fuerte dependencia de la experiencia de cada especialista. Con el fin de lograr una clasificación objetiva basada en parámetros cuantitativos, se buscó extraer caracterı́sticas capaces de representar las diferencias fundamentales entre las voces de Tipos I y II, para luego clasificar una base de datos anotada. Se extrajeron parámetros acústicos clásicos, como medidas de Jitter y Shimmer, y harmonics to noise ratio (HNR) calculados utilizando PRAAT. También se propuso la utilización de la amplitud del primer ramónico (R1) y dos caracterı́sticas ideadas porlos autores de este trabajo: varianza normalizada de la primera componente principal (VNCP) y razones pico-valle (PV) espectrales. La clasificación se realizó mediante máquinas de soporte vectorial (SVM) de kernel lineal utilizando las caracterı́sticas que minimizan el error del clasificador. Como resultado, se obtuvo un error de validación cruzada de 11.61%, con porcentajes de acierto del 93.24% y 83.95%, para voces Tipo I y Tipo II respectivamente.
publishDate 2019
dc.date.none.fl_str_mv 2019-03
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/107373
Miramont, Juan Manuel; Schlotthauer, Gaston; Automatic Classification of Sustained Vowels Based on Signal Regularity Measures; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 23; 1; 3-2019; 55-62
2591-376X
CONICET Digital
CONICET
url http://hdl.handle.net/11336/107373
identifier_str_mv Miramont, Juan Manuel; Schlotthauer, Gaston; Automatic Classification of Sustained Vowels Based on Signal Regularity Measures; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 23; 1; 3-2019; 55-62
2591-376X
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://revista.sabi.org.ar/index.php/revista/issue/view/14
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Sociedad Argentina de Bioingeniería
publisher.none.fl_str_mv Sociedad Argentina de Bioingeniería
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1846782555512111104
score 12.982451