Transferencia de estilo entre audios mediante redes neuronales

Autores
Ordiales, Hernán; Barrera, Gabriel Martín
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
Este trabajo tiene como objetivo aplicar en archivos de audio las técnicas de procesamiento con redes neuronales desarrolladas para la transferencia de estilo en imágenes. En particular, aquellas que son de reciente publicación y dentro de su arquitectura utilizan una o más capas de redes neuronales convolucionales. Para ello, se construyen representaciones de la señal audible en matrices de estructura similar a las que normalmente se utilizan para procesar imágenes. Se evalúan diferentes aproximaciones al problema utilizando técnicas de análisis/síntesis como la transformada de tiempo corto de Fourier (STFT) y la descomposición de la señal de entrada en sinusoides y residuo, derivada del Spectral Modelling Synthesis, históricamente utilizado en señales de voz. Aunque la definición de estilo puede ser subjetiva, se ensayan algunas aproximaciones en su definición y reconocimiento. Para esto, se desarrollan e implementan diferentes programas en Python utilizando el framework Tensor Flow, pensado para construir y entrenar redes neuronales. El resultado es un enfoque diferente para la aplicación de efectos digitales en señales de audio.
Fil: Ordiales, Hernán. Universidad de Palermo. Facultad de Ingeniería; Argentina.
Fil: Barrera, Gabriel Martín. Universidad de Palermo. Facultad de Ingeniería; Argentina.
Materia
PROGRAMAS DE COMPUTADORAS
SISTEMAS EXPERTOS
INGENIERÍA DE PROGRAMAS INFORMÁTICOS
SISTEMAS MULTIMEDIA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc/2.5/ar/
Repositorio
Repositorio Digital UNLaM
Institución
Universidad Nacional de La Matanza
OAI Identificador
oai:repositoriocyt.unlam.edu.ar:123456789/425

id RDUNLAM_d2b50c7ba26b6673f74a48c073bf4f0d
oai_identifier_str oai:repositoriocyt.unlam.edu.ar:123456789/425
network_acronym_str RDUNLAM
repository_id_str a
network_name_str Repositorio Digital UNLaM
spelling Transferencia de estilo entre audios mediante redes neuronalesOrdiales, HernánBarrera, Gabriel MartínPROGRAMAS DE COMPUTADORASSISTEMAS EXPERTOSINGENIERÍA DE PROGRAMAS INFORMÁTICOSSISTEMAS MULTIMEDIAEste trabajo tiene como objetivo aplicar en archivos de audio las técnicas de procesamiento con redes neuronales desarrolladas para la transferencia de estilo en imágenes. En particular, aquellas que son de reciente publicación y dentro de su arquitectura utilizan una o más capas de redes neuronales convolucionales. Para ello, se construyen representaciones de la señal audible en matrices de estructura similar a las que normalmente se utilizan para procesar imágenes. Se evalúan diferentes aproximaciones al problema utilizando técnicas de análisis/síntesis como la transformada de tiempo corto de Fourier (STFT) y la descomposición de la señal de entrada en sinusoides y residuo, derivada del Spectral Modelling Synthesis, históricamente utilizado en señales de voz. Aunque la definición de estilo puede ser subjetiva, se ensayan algunas aproximaciones en su definición y reconocimiento. Para esto, se desarrollan e implementan diferentes programas en Python utilizando el framework Tensor Flow, pensado para construir y entrenar redes neuronales. El resultado es un enfoque diferente para la aplicación de efectos digitales en señales de audio.Fil: Ordiales, Hernán. Universidad de Palermo. Facultad de Ingeniería; Argentina.Fil: Barrera, Gabriel Martín. Universidad de Palermo. Facultad de Ingeniería; Argentina.Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas20192019-10-29T19:06:00Z2019-10-29T19:06:00Zinfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfOrdiales, H., y Barrera, G. M. (2019). Transferencia de estilo entre audios mediante redes neuronales. ReDDi: Revista digital del Departamento de Ingeniería e Investigaciones Tecnológicas de la Universidad Nacional de La Matanza, 4(1). Recuperado de https://reddi.unlam.edu.ar/index.php/ReDDi/article/view/83/1652525-1333http://repositoriocyt.unlam.edu.ar/handle/123456789/425spainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc/2.5/ar/Atribución-NoComercial 2.5 Argentina (CC BY-NC 2.5 AR)reponame:Repositorio Digital UNLaMinstname:Universidad Nacional de La Matanza2026-02-26T14:05:38Zoai:repositoriocyt.unlam.edu.ar:123456789/425instacron:UNLaMInstitucionalhttps://repositoriocyt.unlam.edu.ar/Universidad públicaNo correspondehttps://repositoriocyt.unlam.edu.ar/oaicytunlam@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2026-02-26 14:05:38.396Repositorio Digital UNLaM - Universidad Nacional de La Matanzafalse
dc.title.none.fl_str_mv Transferencia de estilo entre audios mediante redes neuronales
title Transferencia de estilo entre audios mediante redes neuronales
spellingShingle Transferencia de estilo entre audios mediante redes neuronales
Ordiales, Hernán
PROGRAMAS DE COMPUTADORAS
SISTEMAS EXPERTOS
INGENIERÍA DE PROGRAMAS INFORMÁTICOS
SISTEMAS MULTIMEDIA
title_short Transferencia de estilo entre audios mediante redes neuronales
title_full Transferencia de estilo entre audios mediante redes neuronales
title_fullStr Transferencia de estilo entre audios mediante redes neuronales
title_full_unstemmed Transferencia de estilo entre audios mediante redes neuronales
title_sort Transferencia de estilo entre audios mediante redes neuronales
dc.creator.none.fl_str_mv Ordiales, Hernán
Barrera, Gabriel Martín
author Ordiales, Hernán
author_facet Ordiales, Hernán
Barrera, Gabriel Martín
author_role author
author2 Barrera, Gabriel Martín
author2_role author
dc.subject.none.fl_str_mv PROGRAMAS DE COMPUTADORAS
SISTEMAS EXPERTOS
INGENIERÍA DE PROGRAMAS INFORMÁTICOS
SISTEMAS MULTIMEDIA
topic PROGRAMAS DE COMPUTADORAS
SISTEMAS EXPERTOS
INGENIERÍA DE PROGRAMAS INFORMÁTICOS
SISTEMAS MULTIMEDIA
dc.description.none.fl_txt_mv Este trabajo tiene como objetivo aplicar en archivos de audio las técnicas de procesamiento con redes neuronales desarrolladas para la transferencia de estilo en imágenes. En particular, aquellas que son de reciente publicación y dentro de su arquitectura utilizan una o más capas de redes neuronales convolucionales. Para ello, se construyen representaciones de la señal audible en matrices de estructura similar a las que normalmente se utilizan para procesar imágenes. Se evalúan diferentes aproximaciones al problema utilizando técnicas de análisis/síntesis como la transformada de tiempo corto de Fourier (STFT) y la descomposición de la señal de entrada en sinusoides y residuo, derivada del Spectral Modelling Synthesis, históricamente utilizado en señales de voz. Aunque la definición de estilo puede ser subjetiva, se ensayan algunas aproximaciones en su definición y reconocimiento. Para esto, se desarrollan e implementan diferentes programas en Python utilizando el framework Tensor Flow, pensado para construir y entrenar redes neuronales. El resultado es un enfoque diferente para la aplicación de efectos digitales en señales de audio.
Fil: Ordiales, Hernán. Universidad de Palermo. Facultad de Ingeniería; Argentina.
Fil: Barrera, Gabriel Martín. Universidad de Palermo. Facultad de Ingeniería; Argentina.
description Este trabajo tiene como objetivo aplicar en archivos de audio las técnicas de procesamiento con redes neuronales desarrolladas para la transferencia de estilo en imágenes. En particular, aquellas que son de reciente publicación y dentro de su arquitectura utilizan una o más capas de redes neuronales convolucionales. Para ello, se construyen representaciones de la señal audible en matrices de estructura similar a las que normalmente se utilizan para procesar imágenes. Se evalúan diferentes aproximaciones al problema utilizando técnicas de análisis/síntesis como la transformada de tiempo corto de Fourier (STFT) y la descomposición de la señal de entrada en sinusoides y residuo, derivada del Spectral Modelling Synthesis, históricamente utilizado en señales de voz. Aunque la definición de estilo puede ser subjetiva, se ensayan algunas aproximaciones en su definición y reconocimiento. Para esto, se desarrollan e implementan diferentes programas en Python utilizando el framework Tensor Flow, pensado para construir y entrenar redes neuronales. El resultado es un enfoque diferente para la aplicación de efectos digitales en señales de audio.
publishDate 2019
dc.date.none.fl_str_mv 2019
2019-10-29T19:06:00Z
2019-10-29T19:06:00Z
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv Ordiales, H., y Barrera, G. M. (2019). Transferencia de estilo entre audios mediante redes neuronales. ReDDi: Revista digital del Departamento de Ingeniería e Investigaciones Tecnológicas de la Universidad Nacional de La Matanza, 4(1). Recuperado de https://reddi.unlam.edu.ar/index.php/ReDDi/article/view/83/165
2525-1333
http://repositoriocyt.unlam.edu.ar/handle/123456789/425
identifier_str_mv Ordiales, H., y Barrera, G. M. (2019). Transferencia de estilo entre audios mediante redes neuronales. ReDDi: Revista digital del Departamento de Ingeniería e Investigaciones Tecnológicas de la Universidad Nacional de La Matanza, 4(1). Recuperado de https://reddi.unlam.edu.ar/index.php/ReDDi/article/view/83/165
2525-1333
url http://repositoriocyt.unlam.edu.ar/handle/123456789/425
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc/2.5/ar/
Atribución-NoComercial 2.5 Argentina (CC BY-NC 2.5 AR)
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc/2.5/ar/
Atribución-NoComercial 2.5 Argentina (CC BY-NC 2.5 AR)
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
publisher.none.fl_str_mv Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
dc.source.none.fl_str_mv reponame:Repositorio Digital UNLaM
instname:Universidad Nacional de La Matanza
reponame_str Repositorio Digital UNLaM
collection Repositorio Digital UNLaM
instname_str Universidad Nacional de La Matanza
repository.name.fl_str_mv Repositorio Digital UNLaM - Universidad Nacional de La Matanza
repository.mail.fl_str_mv cytunlam@gmail.com
_version_ 1858211112571371520
score 13.176822