Vocal caricatures reveal signatures of speaker identity

Autores
Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; Trevisan, Marcos Alberto
Año de publicación
2013
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.
Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; Argentina
Fil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Materia
PHYSICS
BIOLOGICAL PHYSICS
AUDITORY SYSTEM
SPEAKER RECOGNITION
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/18274

id CONICETDig_a60948d1119e4419bd07416e4fd452ab
oai_identifier_str oai:ri.conicet.gov.ar:11336/18274
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Vocal caricatures reveal signatures of speaker identityLopez, Sabrina LauraRiera, Pablo ErnestoAssaneo, María FlorenciaEguia, Manuel CamiloSigman, MarianoTrevisan, Marcos AlbertoPHYSICSBIOLOGICAL PHYSICSAUDITORY SYSTEMSPEAKER RECOGNITIONhttps://purl.org/becyt/ford/1.3https://purl.org/becyt/ford/1What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaFil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaFil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; ArgentinaFil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaNature Publishing Group2013-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/18274Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 34070284-1703CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/doi/10.1038/srep03407info:eu-repo/semantics/altIdentifier/url/https://www.nature.com/articles/srep03407info:eu-repo/semantics/altIdentifier/ark/https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3847701/info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T10:00:37Zoai:ri.conicet.gov.ar:11336/18274instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 10:00:38.167CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Vocal caricatures reveal signatures of speaker identity
title Vocal caricatures reveal signatures of speaker identity
spellingShingle Vocal caricatures reveal signatures of speaker identity
Lopez, Sabrina Laura
PHYSICS
BIOLOGICAL PHYSICS
AUDITORY SYSTEM
SPEAKER RECOGNITION
title_short Vocal caricatures reveal signatures of speaker identity
title_full Vocal caricatures reveal signatures of speaker identity
title_fullStr Vocal caricatures reveal signatures of speaker identity
title_full_unstemmed Vocal caricatures reveal signatures of speaker identity
title_sort Vocal caricatures reveal signatures of speaker identity
dc.creator.none.fl_str_mv Lopez, Sabrina Laura
Riera, Pablo Ernesto
Assaneo, María Florencia
Eguia, Manuel Camilo
Sigman, Mariano
Trevisan, Marcos Alberto
author Lopez, Sabrina Laura
author_facet Lopez, Sabrina Laura
Riera, Pablo Ernesto
Assaneo, María Florencia
Eguia, Manuel Camilo
Sigman, Mariano
Trevisan, Marcos Alberto
author_role author
author2 Riera, Pablo Ernesto
Assaneo, María Florencia
Eguia, Manuel Camilo
Sigman, Mariano
Trevisan, Marcos Alberto
author2_role author
author
author
author
author
dc.subject.none.fl_str_mv PHYSICS
BIOLOGICAL PHYSICS
AUDITORY SYSTEM
SPEAKER RECOGNITION
topic PHYSICS
BIOLOGICAL PHYSICS
AUDITORY SYSTEM
SPEAKER RECOGNITION
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.3
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.
Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; Argentina
Fil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
description What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.
publishDate 2013
dc.date.none.fl_str_mv 2013-12
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/18274
Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 3407
0284-1703
CONICET Digital
CONICET
url http://hdl.handle.net/11336/18274
identifier_str_mv Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 3407
0284-1703
CONICET Digital
CONICET
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/doi/10.1038/srep03407
info:eu-repo/semantics/altIdentifier/url/https://www.nature.com/articles/srep03407
info:eu-repo/semantics/altIdentifier/ark/https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3847701/
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
application/pdf
application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Nature Publishing Group
publisher.none.fl_str_mv Nature Publishing Group
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844613790135484416
score 13.070432