Variational autoencoders para el modelado de estilos de música
- Autores
- Somacal, Lucas
- Año de publicación
- 2023
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Miguel, Martín
Fernández Slezak, Diego - Descripción
- En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.
In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.
Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
VAE
TRANSFERENCIA DE ESTILOS
APRENDIZAJE AUTOMATICO
MUSICA
APRENDIZAJE PROFUNDO
VAE
STYLE TRANSFER
MACHINE LEARNING
MUSIC
DEEP LEARNING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000872_Somacal
Ver los metadatos del registro completo
| id |
BDUBAFCEN_3f2e649b807e9e97e0c4b638ea3e0fbe |
|---|---|
| oai_identifier_str |
seminario:seminario_nCOM000872_Somacal |
| network_acronym_str |
BDUBAFCEN |
| repository_id_str |
1896 |
| network_name_str |
Biblioteca Digital (UBA-FCEN) |
| spelling |
Variational autoencoders para el modelado de estilos de músicaVariational autoencoders to model music stylesSomacal, LucasVAETRANSFERENCIA DE ESTILOSAPRENDIZAJE AUTOMATICOMUSICAAPRENDIZAJE PROFUNDOVAESTYLE TRANSFERMACHINE LEARNINGMUSICDEEP LEARNINGEn el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados.In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results.Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMiguel, MartínFernández Slezak, Diego2023-12-21info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacalspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-04-16T09:50:46Zseminario:seminario_nCOM000872_SomacalInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-04-16 09:50:48.5Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
| dc.title.none.fl_str_mv |
Variational autoencoders para el modelado de estilos de música Variational autoencoders to model music styles |
| title |
Variational autoencoders para el modelado de estilos de música |
| spellingShingle |
Variational autoencoders para el modelado de estilos de música Somacal, Lucas VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING |
| title_short |
Variational autoencoders para el modelado de estilos de música |
| title_full |
Variational autoencoders para el modelado de estilos de música |
| title_fullStr |
Variational autoencoders para el modelado de estilos de música |
| title_full_unstemmed |
Variational autoencoders para el modelado de estilos de música |
| title_sort |
Variational autoencoders para el modelado de estilos de música |
| dc.creator.none.fl_str_mv |
Somacal, Lucas |
| author |
Somacal, Lucas |
| author_facet |
Somacal, Lucas |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Miguel, Martín Fernández Slezak, Diego |
| dc.subject.none.fl_str_mv |
VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING |
| topic |
VAE TRANSFERENCIA DE ESTILOS APRENDIZAJE AUTOMATICO MUSICA APRENDIZAJE PROFUNDO VAE STYLE TRANSFER MACHINE LEARNING MUSIC DEEP LEARNING |
| dc.description.none.fl_txt_mv |
En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados. In this work, we addressed the style transfer problem in music, that is, trying to change a musical fragment from a certain musical style to another. Based on previous work, we consider the manipulation of latent space from a Variational Autoencoder (VAE) with which we encode musical fragments to this space and operate through characteristic vectors of each musical style. In this work, we aimed to achieve style transfer between 4 specific styles. To that end, we compared three models. One was trained with a dataset of general music and then evaluated in the target dataset of 4 styles. The second model was finetuned on the target dataset and the third, only trained on this dataset. As part of this work, we also present an automatic evaluation methodology to measure whether the fragments generated are musical, resemble the new style and maintain the identity of the original fragment. The three models achieved musical transformations with a change of style. In particular, we observe that musicality and similarity with the original are lost as the transformation is greater but in turn they come closer to the new style as the magnitude of the transformation grows, at the same time the models trained on the greater dataset get better results. Fil: Somacal, Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
| description |
En el presente trabajo se abordó el problema de transferencia de estilo en música, es decir, intentar cambiar un fragmento musical de cierto estilo musical a otro. Basándonos en trabajo previo, consideramos la manipulación del espacio latente a partir de un Variational Autoencoder (VAE) con el que codificamos fragmentos musicales a este espacio y operamos mediante vectores característicos de cada estilo musical. En este trabajo, nos propusimos lograr transferencia de estilos entre 4 específicos. A ese fin, comparamos tres modelos. Uno fue entrenado con un dataset de música general y luego evaluado en el dataset objetivo de 4 estilos. El segundo modelo fue fine-tuneado sobre el dataset objetivo y el tercero, solo entrenado sobre este dataset. Como parte de este trabajo, también presentamos una metodología de evaluación automática para medir si los fragmentos generados son musicales, se parecen al nuevo estilo y mantienen la identidad del fragmento original. Los tres modelos lograron transformaciones musicales con cambio de estilo. En particular, observamos que la musicalidad y la similitud con el original se van perdiendo a medida que la transformación es mayor pero a su vez se acercan cada vez más al nuevo estilo a medida que crece la magnitud de la transformación, a la vez que el los modelos entrenados sobre el dataset mayor obtienen mejores resultados. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12-21 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal |
| url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000872_Somacal |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
| reponame_str |
Biblioteca Digital (UBA-FCEN) |
| collection |
Biblioteca Digital (UBA-FCEN) |
| instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| instacron_str |
UBA-FCEN |
| institution |
UBA-FCEN |
| repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
| _version_ |
1862634778798325760 |
| score |
13.05261 |