Variational autoencoders para el modelado de estilos de música

Autores
Somacal, Lucas
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Miguel, Martín
Fernández Slezak, Diego
Descripción
En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.
Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000872_Somacal

id BDUBAFCEN_3f2e649b807e9e97e0c4b638ea3e0fbe
oai_identifier_str seminario:seminario_nCOM000872_Somacal
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Variational autoencoders para el modelado de estilos de músicaVariational autoencoders to model music stylesSomacal, LucasVAETRANSFERENCIA DE ESTILOSAPRENDIZAJE AUTOMATICOMUSICAAPRENDIZAJE PROFUNDOVAESTYLE TRANSFERMACHINE LEARNINGMUSICDEEP LEARNINGEn el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMiguel, MartínFernández Slezak, Diego2023-12-21info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacalspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-04-16T09:50:46Zseminario:seminario_nCOM000872_SomacalInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-04-16 09:50:48.5Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Variational autoencoders para el modelado de estilos de música
Variational autoencoders to model music styles
title Variational autoencoders para el modelado de estilos de música
spellingShingle Variational autoencoders para el modelado de estilos de música
Somacal, Lucas
VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING
title_short Variational autoencoders para el modelado de estilos de música
title_full Variational autoencoders para el modelado de estilos de música
title_fullStr Variational autoencoders para el modelado de estilos de música
title_full_unstemmed Variational autoencoders para el modelado de estilos de música
title_sort Variational autoencoders para el modelado de estilos de música
dc.creator.none.fl_str_mv Somacal, Lucas
author Somacal, Lucas
author_facet Somacal, Lucas
author_role author
dc.contributor.none.fl_str_mv Miguel, Martín
Fernández Slezak, Diego
dc.subject.none.fl_str_mv VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING
topic VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING
dc.description.none.fl_txt_mv En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.
Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-21
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal
url https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1862634778798325760
score 13.05261