Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas
- Autores
- Ríos, Gastón Gustavo
- Año de publicación
- 2022
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados.
Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Beca Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Informática Tipo de investigación: Básica
Facultad de Informática - Materia
-
Cs de la Computación
Aprendizaje automático
Redes neuronales
Sistemas inteligentes
Visión por computadora
Generacion de imagenes
Artificial inteligence
Artificial neural networks
Computer vision
Machine learning
Image generation - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/145619
Ver los metadatos del registro completo
id |
SEDICI_9c7e5d9a50135ccfd5b37f1c8c5a5727 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/145619 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señasImage Generation using Machine Learning. Applied to Sign Language Recognition.Ríos, Gastón GustavoCs de la ComputaciónAprendizaje automáticoRedes neuronalesSistemas inteligentesVisión por computadoraGeneracion de imagenesArtificial inteligenceArtificial neural networksComputer visionMachine learningImage generationEl objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados.Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Beca Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Informática Tipo de investigación: BásicaFacultad de Informática2022-11-23info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/145619spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:37:08Zoai:sedici.unlp.edu.ar:10915/145619Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:37:09.018SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas Image Generation using Machine Learning. Applied to Sign Language Recognition. |
title |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
spellingShingle |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas Ríos, Gastón Gustavo Cs de la Computación Aprendizaje automático Redes neuronales Sistemas inteligentes Visión por computadora Generacion de imagenes Artificial inteligence Artificial neural networks Computer vision Machine learning Image generation |
title_short |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
title_full |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
title_fullStr |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
title_full_unstemmed |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
title_sort |
Generación de imágenes con técnicas de aprendizaje automático : Aplicaciones en reconocimiento de lengua de señas |
dc.creator.none.fl_str_mv |
Ríos, Gastón Gustavo |
author |
Ríos, Gastón Gustavo |
author_facet |
Ríos, Gastón Gustavo |
author_role |
author |
dc.subject.none.fl_str_mv |
Cs de la Computación Aprendizaje automático Redes neuronales Sistemas inteligentes Visión por computadora Generacion de imagenes Artificial inteligence Artificial neural networks Computer vision Machine learning Image generation |
topic |
Cs de la Computación Aprendizaje automático Redes neuronales Sistemas inteligentes Visión por computadora Generacion de imagenes Artificial inteligence Artificial neural networks Computer vision Machine learning Image generation |
dc.description.none.fl_txt_mv |
El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados. Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Beca Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Informática Tipo de investigación: Básica Facultad de Informática |
description |
El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-11-23 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/145619 |
url |
http://sedici.unlp.edu.ar/handle/10915/145619 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616249116459008 |
score |
13.069144 |