Variational autoencoders para el modelado de estilos de música

Autores: Somacal, Lucas
Año de publicación: 2023
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Miguel, Martín
Fernández Slezak, Diego
Descripción: En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.
Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia: VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Institución: Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador: seminario:seminario_nCOM000872_Somacal

Acceder

id	BDUBAFCEN_3f2e649b807e9e97e0c4b638ea3e0fbe
oai_identifier_str	seminario:seminario_nCOM000872_Somacal
network_acronym_str	BDUBAFCEN
repository_id_str	1896
network_name_str	Biblioteca Digital (UBA-FCEN)
spelling	Variational autoencoders para el modelado de estilos de músicaVariational autoencoders to model music stylesSomacal, LucasVAETRANSFERENCIA DE ESTILOSAPRENDIZAJE AUTOMATICOMUSICAAPRENDIZAJE PROFUNDOVAESTYLE TRANSFERMACHINE LEARNINGMUSICDEEP LEARNINGEn el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMiguel, MartínFernández Slezak, Diego2023-12-21info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacalspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-06-04T09:43:42Zseminario:seminario_nCOM000872_SomacalInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-06-04 09:43:43.748Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv	Variational autoencoders para el modelado de estilos de música Variational autoencoders to model music styles
title	Variational autoencoders para el modelado de estilos de música
spellingShingle	Variational autoencoders para el modelado de estilos de música Somacal, Lucas VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING
title_short	Variational autoencoders para el modelado de estilos de música
title_full	Variational autoencoders para el modelado de estilos de música
title_fullStr	Variational autoencoders para el modelado de estilos de música
title_full_unstemmed	Variational autoencoders para el modelado de estilos de música
title_sort	Variational autoencoders para el modelado de estilos de música
dc.creator.none.fl_str_mv	Somacal, Lucas
author	Somacal, Lucas
author_facet	Somacal, Lucas
author_role	author
dc.contributor.none.fl_str_mv	Miguel, Martín Fernández Slezak, Diego
dc.subject.none.fl_str_mv	VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING
topic	VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING
dc.description.none.fl_txt_mv	En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados. In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results. Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description	En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
publishDate	2023
dc.date.none.fl_str_mv	2023-12-21
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal
url	https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv	reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN
reponame_str	Biblioteca Digital (UBA-FCEN)
collection	Biblioteca Digital (UBA-FCEN)
instname_str	Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str	UBA-FCEN
institution	UBA-FCEN
repository.name.fl_str_mv	Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv	ana@bl.fcen.uba.ar
_version_	1867091004649111553
score	12.832306

Variational autoencoders para el modelado de estilos de música

Publicaciones similares