Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
- Autores
- Rios, Gastón Gustavo
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.
Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: Aplicada
Facultad de Informática - Materia
-
Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/173140
Ver los metadatos del registro completo
id |
SEDICI_99708262b6ccfef668f7fff43771bda4 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/173140 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicosAutomatic Video Generation Using Deep Learning: Application in Dynamic Gesture RecognitionRios, Gastón GustavoCs de la ComputaciónReconocimiento de Lengua de SeñasAprendizaje ProfundoModelos GenerativosAumentacion de DatosDatos Limitadossign language recognitiondeep learninggenerative modelsdata augmentationlimited dataEl objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: AplicadaFacultad de Informática2024-11-20info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/173140spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:46:29Zoai:sedici.unlp.edu.ar:10915/173140Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:46:29.198SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos Automatic Video Generation Using Deep Learning: Application in Dynamic Gesture Recognition |
title |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
spellingShingle |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos Rios, Gastón Gustavo Cs de la Computación Reconocimiento de Lengua de Señas Aprendizaje Profundo Modelos Generativos Aumentacion de Datos Datos Limitados sign language recognition deep learning generative models data augmentation limited data |
title_short |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
title_full |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
title_fullStr |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
title_full_unstemmed |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
title_sort |
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos |
dc.creator.none.fl_str_mv |
Rios, Gastón Gustavo |
author |
Rios, Gastón Gustavo |
author_facet |
Rios, Gastón Gustavo |
author_role |
author |
dc.subject.none.fl_str_mv |
Cs de la Computación Reconocimiento de Lengua de Señas Aprendizaje Profundo Modelos Generativos Aumentacion de Datos Datos Limitados sign language recognition deep learning generative models data augmentation limited data |
topic |
Cs de la Computación Reconocimiento de Lengua de Señas Aprendizaje Profundo Modelos Generativos Aumentacion de Datos Datos Limitados sign language recognition deep learning generative models data augmentation limited data |
dc.description.none.fl_txt_mv |
El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: Aplicada Facultad de Informática |
description |
El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-11-20 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/173140 |
url |
http://sedici.unlp.edu.ar/handle/10915/173140 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616329812770816 |
score |
13.070432 |