Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas
- Autores
- Ríos, Gastón Gustavo; Dal Bianco, Pedro Alejandro; Ronchetti, Franco; Quiroga, Facundo Manuel; Stanchi, Oscar; Hasperué, Waldo
- Año de publicación
- 2023
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas.
Red de Universidades con Carreras en Informática
Instituto de Investigación en Informática - Materia
-
Ciencias Informáticas
Reconocimiento de señas
Lengua de señas
Red generativa antagónica
SPADE
ACGAN
Estimación de pose - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/164827
Ver los metadatos del registro completo
id |
SEDICI_0fe019ae0ff3b6e2fdfd4f80668d2e4b |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/164827 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetasRíos, Gastón GustavoDal Bianco, Pedro AlejandroRonchetti, FrancoQuiroga, Facundo ManuelStanchi, OscarHasperué, WaldoCiencias InformáticasReconocimiento de señasLengua de señasRed generativa antagónicaSPADEACGANEstimación de poseObtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas.Red de Universidades con Carreras en InformáticaInstituto de Investigación en Informática2023-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf18-26http://sedici.unlp.edu.ar/handle/10915/164827spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-9285-51-0info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/163107info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:35:31Zoai:sedici.unlp.edu.ar:10915/164827Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:35:31.425SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
title |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
spellingShingle |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas Ríos, Gastón Gustavo Ciencias Informáticas Reconocimiento de señas Lengua de señas Red generativa antagónica SPADE ACGAN Estimación de pose |
title_short |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
title_full |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
title_fullStr |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
title_full_unstemmed |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
title_sort |
Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas |
dc.creator.none.fl_str_mv |
Ríos, Gastón Gustavo Dal Bianco, Pedro Alejandro Ronchetti, Franco Quiroga, Facundo Manuel Stanchi, Oscar Hasperué, Waldo |
author |
Ríos, Gastón Gustavo |
author_facet |
Ríos, Gastón Gustavo Dal Bianco, Pedro Alejandro Ronchetti, Franco Quiroga, Facundo Manuel Stanchi, Oscar Hasperué, Waldo |
author_role |
author |
author2 |
Dal Bianco, Pedro Alejandro Ronchetti, Franco Quiroga, Facundo Manuel Stanchi, Oscar Hasperué, Waldo |
author2_role |
author author author author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Reconocimiento de señas Lengua de señas Red generativa antagónica SPADE ACGAN Estimación de pose |
topic |
Ciencias Informáticas Reconocimiento de señas Lengua de señas Red generativa antagónica SPADE ACGAN Estimación de pose |
dc.description.none.fl_txt_mv |
Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas. Red de Universidades con Carreras en Informática Instituto de Investigación en Informática |
description |
Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-10 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/164827 |
url |
http://sedici.unlp.edu.ar/handle/10915/164827 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-9285-51-0 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/163107 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf 18-26 |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1846064379710144512 |
score |
13.221938 |