Producción de la voz, control neuronal y biometría

Autores
Trevisan, Marcos Alberto
Año de publicación
2006
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Mindlin, Gabriel Bernardo
Descripción
Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.
This work is twofolded. The rst part is devoted to voice biometrics, i.e. the problem of a one to one characterization between voice and speaker. The second part is dedicated to the neural vocal control. In the history of voice biometrics, efforts to unveil the speaker's identity were based on spectral descriptions of voiced sounds. The relative success of these techniques is due to the difficulty of establishing how close is close enough when comparing spectral features. Every system needs a threshold to be defined in order to accept or reject users. In the rst part of this work we explore alternatives to this point of view. In the rst place, we built a low dimensional dynamical system which allowed us reproducing the diversity of the vocal processes in terms of a minimal set of anatomically relevant parameters. Once the model was constructed, a question naturally arised: Could its parameters reproduce a particular speaker's voice? Our results leaded to a second perspective which introduces the concept topological voiceprints based on a set of tools created in order to characterize the orbits structure of dynamical systems. That tools allowed us to translate spectral features into sets of robust integers. Our results suggest a new direction in the identification of subjects by voice: one in which arrangements of integers dene voiceprints that stand on their own, despite any acceptance/rejection thresholds. The second part of this work is devoted to the interaction of the vocal system in a simple animal model (birds) and the neural substrate controlling its dynamics. During the last few decades, birdsong developed into a privileged research eld that allowed neuroscientists to experiment with biological organisms that developed vocal learning skills presenting strong analogies with language acquisition. In the present, birdsong is becoming a denite eld of neural modeling. Research in this eld is devoted to understand the emergengy of complex acoustic patterns and to study the neural architecture of vocal learning, independently from social and cultural factors involved in language acquisition. Based on the human vocal model, we developed neural models to address these two specic problems.
Fil: Trevisan, Marcos Alberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n4470_Trevisan

id BDUBAFCEN_023bbaa9ee2b982a310fd240d2f587a1
oai_identifier_str tesis:tesis_n4470_Trevisan
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Producción de la voz, control neuronal y biometríaTrevisan, Marcos AlbertoFISICA DE LA VOZBIOMETRIATOPOLOGIACONTROL NEURONAL VOCALVOICE PHYSICSBIOMETRICSTOPOLOGYNEURAL MOTOR CONTROLEste trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.This work is twofolded. The rst part is devoted to voice biometrics, i.e. the problem of a one to one characterization between voice and speaker. The second part is dedicated to the neural vocal control. In the history of voice biometrics, efforts to unveil the speaker's identity were based on spectral descriptions of voiced sounds. The relative success of these techniques is due to the difficulty of establishing how close is close enough when comparing spectral features. Every system needs a threshold to be defined in order to accept or reject users. In the rst part of this work we explore alternatives to this point of view. In the rst place, we built a low dimensional dynamical system which allowed us reproducing the diversity of the vocal processes in terms of a minimal set of anatomically relevant parameters. Once the model was constructed, a question naturally arised: Could its parameters reproduce a particular speaker's voice? Our results leaded to a second perspective which introduces the concept topological voiceprints based on a set of tools created in order to characterize the orbits structure of dynamical systems. That tools allowed us to translate spectral features into sets of robust integers. Our results suggest a new direction in the identification of subjects by voice: one in which arrangements of integers dene voiceprints that stand on their own, despite any acceptance/rejection thresholds. The second part of this work is devoted to the interaction of the vocal system in a simple animal model (birds) and the neural substrate controlling its dynamics. During the last few decades, birdsong developed into a privileged research eld that allowed neuroscientists to experiment with biological organisms that developed vocal learning skills presenting strong analogies with language acquisition. In the present, birdsong is becoming a denite eld of neural modeling. Research in this eld is devoted to understand the emergengy of complex acoustic patterns and to study the neural architecture of vocal learning, independently from social and cultural factors involved in language acquisition. Based on the human vocal model, we developed neural models to address these two specic problems.Fil: Trevisan, Marcos Alberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMindlin, Gabriel Bernardo2006info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n4470_Trevisanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:35Ztesis:tesis_n4470_TrevisanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:36.818Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Producción de la voz, control neuronal y biometría
title Producción de la voz, control neuronal y biometría
spellingShingle Producción de la voz, control neuronal y biometría
Trevisan, Marcos Alberto
FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
title_short Producción de la voz, control neuronal y biometría
title_full Producción de la voz, control neuronal y biometría
title_fullStr Producción de la voz, control neuronal y biometría
title_full_unstemmed Producción de la voz, control neuronal y biometría
title_sort Producción de la voz, control neuronal y biometría
dc.creator.none.fl_str_mv Trevisan, Marcos Alberto
author Trevisan, Marcos Alberto
author_facet Trevisan, Marcos Alberto
author_role author
dc.contributor.none.fl_str_mv Mindlin, Gabriel Bernardo
dc.subject.none.fl_str_mv FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
topic FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
dc.description.none.fl_txt_mv Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.
This work is twofolded. The rst part is devoted to voice biometrics, i.e. the problem of a one to one characterization between voice and speaker. The second part is dedicated to the neural vocal control. In the history of voice biometrics, efforts to unveil the speaker's identity were based on spectral descriptions of voiced sounds. The relative success of these techniques is due to the difficulty of establishing how close is close enough when comparing spectral features. Every system needs a threshold to be defined in order to accept or reject users. In the rst part of this work we explore alternatives to this point of view. In the rst place, we built a low dimensional dynamical system which allowed us reproducing the diversity of the vocal processes in terms of a minimal set of anatomically relevant parameters. Once the model was constructed, a question naturally arised: Could its parameters reproduce a particular speaker's voice? Our results leaded to a second perspective which introduces the concept topological voiceprints based on a set of tools created in order to characterize the orbits structure of dynamical systems. That tools allowed us to translate spectral features into sets of robust integers. Our results suggest a new direction in the identification of subjects by voice: one in which arrangements of integers dene voiceprints that stand on their own, despite any acceptance/rejection thresholds. The second part of this work is devoted to the interaction of the vocal system in a simple animal model (birds) and the neural substrate controlling its dynamics. During the last few decades, birdsong developed into a privileged research eld that allowed neuroscientists to experiment with biological organisms that developed vocal learning skills presenting strong analogies with language acquisition. In the present, birdsong is becoming a denite eld of neural modeling. Research in this eld is devoted to understand the emergengy of complex acoustic patterns and to study the neural architecture of vocal learning, independently from social and cultural factors involved in language acquisition. Based on the human vocal model, we developed neural models to address these two specic problems.
Fil: Trevisan, Marcos Alberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.
publishDate 2006
dc.date.none.fl_str_mv 2006
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
url https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618709672394752
score 13.070432