Vocal caricatures reveal signatures of speaker identity

Autores: Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; Trevisan, Marcos Alberto
Año de publicación: 2013
Idioma: inglés
Tipo de recurso: artículo
Estado: versión publicada
Descripción: What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.
Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Fil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; Argentina
Fil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
Materia: PHYSICS
BIOLOGICAL PHYSICS
AUDITORY SYSTEM
SPEAKER RECOGNITION
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Institución: Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador: oai:ri.conicet.gov.ar:11336/18274

Acceder

id	CONICETDig_a60948d1119e4419bd07416e4fd452ab
oai_identifier_str	oai:ri.conicet.gov.ar:11336/18274
network_acronym_str	CONICETDig
repository_id_str	3498
network_name_str	CONICET Digital (CONICET)
spelling	Vocal caricatures reveal signatures of speaker identityLopez, Sabrina LauraRiera, Pablo ErnestoAssaneo, María FlorenciaEguia, Manuel CamiloSigman, MarianoTrevisan, Marcos AlbertoPHYSICSBIOLOGICAL PHYSICSAUDITORY SYSTEMSPEAKER RECOGNITIONhttps://purl.org/becyt/ford/1.3https://purl.org/becyt/ford/1What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaFil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaFil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; ArgentinaFil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; ArgentinaNature Publishing Group2013-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/18274Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 34070284-1703CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/doi/10.1038/srep03407info:eu-repo/semantics/altIdentifier/url/https://www.nature.com/articles/srep03407info:eu-repo/semantics/altIdentifier/ark/https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3847701/info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2026-06-04T11:01:56Zoai:ri.conicet.gov.ar:11336/18274instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982026-06-04 11:01:57.195CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv	Vocal caricatures reveal signatures of speaker identity
title	Vocal caricatures reveal signatures of speaker identity
spellingShingle	Vocal caricatures reveal signatures of speaker identity Lopez, Sabrina Laura PHYSICS BIOLOGICAL PHYSICS AUDITORY SYSTEM SPEAKER RECOGNITION
title_short	Vocal caricatures reveal signatures of speaker identity
title_full	Vocal caricatures reveal signatures of speaker identity
title_fullStr	Vocal caricatures reveal signatures of speaker identity
title_full_unstemmed	Vocal caricatures reveal signatures of speaker identity
title_sort	Vocal caricatures reveal signatures of speaker identity
dc.creator.none.fl_str_mv	Lopez, Sabrina Laura Riera, Pablo Ernesto Assaneo, María Florencia Eguia, Manuel Camilo Sigman, Mariano Trevisan, Marcos Alberto
author	Lopez, Sabrina Laura
author_facet	Lopez, Sabrina Laura Riera, Pablo Ernesto Assaneo, María Florencia Eguia, Manuel Camilo Sigman, Mariano Trevisan, Marcos Alberto
author_role	author
author2	Riera, Pablo Ernesto Assaneo, María Florencia Eguia, Manuel Camilo Sigman, Mariano Trevisan, Marcos Alberto
author2_role	author author author author author
dc.subject.none.fl_str_mv	PHYSICS BIOLOGICAL PHYSICS AUDITORY SYSTEM SPEAKER RECOGNITION
topic	PHYSICS BIOLOGICAL PHYSICS AUDITORY SYSTEM SPEAKER RECOGNITION
purl_subject.fl_str_mv	https://purl.org/becyt/ford/1.3 https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv	What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space. Fil: Lopez, Sabrina Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina Fil: Riera, Pablo Ernesto. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina Fil: Assaneo, María Florencia. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina Fil: Eguia, Manuel Camilo. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología. Laboratorio de Acustica y Percepción Sonora; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina Fil: Sigman, Mariano. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Neurociencia Integrativa; Argentina. Universidad Torcuato Di Tella; Argentina Fil: Trevisan, Marcos Alberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Física de Buenos Aires. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Física de Buenos Aires; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Física. Laboratorio de Sistemas Dinámicos; Argentina
description	What are the features that impersonators select to elicit a speaker’s identity? We built a voice database of public figures (targets) and imitations produced by professional impersonators. They produced one imitation based on their memory of the target (caricature) and another one after listening to the target audio (replica). A set of naive participants then judged identity and similarity of pairs of voices. Identity was better evoked by the caricatures and replicas were perceived to be closer to the targets in terms of voice similarity. We used this data to map relevant acoustic dimensions for each task. Our results indicate that speaker identity is mainly associated with vocal tract features, while perception of voice similarity is related to vocal folds parameters. We therefore show the way in which acoustic caricatures emphasize identity features at the cost of loosing similarity, which allows drawing an analogy with caricatures in the visual space.
publishDate	2013
dc.date.none.fl_str_mv	2013-12
dc.type.none.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo
format	article
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11336/18274 Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 3407 0284-1703 CONICET Digital CONICET
url	http://hdl.handle.net/11336/18274
identifier_str_mv	Lopez, Sabrina Laura; Riera, Pablo Ernesto; Assaneo, María Florencia; Eguia, Manuel Camilo; Sigman, Mariano; et al.; Vocal caricatures reveal signatures of speaker identity; Nature Publishing Group; Scientific Reports; 3; 12-2013; 1-7; 3407 0284-1703 CONICET Digital CONICET
dc.language.none.fl_str_mv	eng
language	eng
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/doi/10.1038/srep03407 info:eu-repo/semantics/altIdentifier/url/https://www.nature.com/articles/srep03407 info:eu-repo/semantics/altIdentifier/ark/https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3847701/
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv	application/pdf application/pdf application/pdf application/pdf application/pdf application/pdf application/pdf
dc.publisher.none.fl_str_mv	Nature Publishing Group
publisher.none.fl_str_mv	Nature Publishing Group
dc.source.none.fl_str_mv	reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str	CONICET Digital (CONICET)
collection	CONICET Digital (CONICET)
instname_str	Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv	CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv	dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_	1867098796332154880
score	12.832306

Vocal caricatures reveal signatures of speaker identity

Publicaciones similares