Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos

Autores
Rios, Gastón Gustavo
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.
Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: Aplicada
Facultad de Informática
Materia
Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/173140

id SEDICI_99708262b6ccfef668f7fff43771bda4
oai_identifier_str oai:sedici.unlp.edu.ar:10915/173140
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicosAutomatic Video Generation Using Deep Learning: Application in Dynamic Gesture RecognitionRios, Gastón GustavoCs de la ComputaciónReconocimiento de Lengua de SeñasAprendizaje ProfundoModelos GenerativosAumentacion de DatosDatos Limitadossign language recognitiondeep learninggenerative modelsdata augmentationlimited dataEl objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: AplicadaFacultad de Informática2024-11-20info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/173140spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:46:29Zoai:sedici.unlp.edu.ar:10915/173140Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:46:29.198SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
Automatic Video Generation Using Deep Learning: Application in Dynamic Gesture Recognition
title Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
spellingShingle Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
Rios, Gastón Gustavo
Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
title_short Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_full Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_fullStr Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_full_unstemmed Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_sort Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
dc.creator.none.fl_str_mv Rios, Gastón Gustavo
author Rios, Gastón Gustavo
author_facet Rios, Gastón Gustavo
author_role author
dc.subject.none.fl_str_mv Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
topic Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
dc.description.none.fl_txt_mv El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.
Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: Aplicada
Facultad de Informática
description El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-20
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/173140
url http://sedici.unlp.edu.ar/handle/10915/173140
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616329812770816
score 13.070432