Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas

Autores: Ríos, Gastón Gustavo
Año de publicación: 2020
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados.
Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Tipo de investigación: Aplicada
Facultad de Informática
Instituto de Investigación en Informática
Materia: Ciencias Informáticas
Sistemas inteligentes e IA
Visión por computadora
Redes neuronales
Aprendizaje automático
Artificial intelligence
Computer vision
Artificial neural networks
Machine learning
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/114330

Acceder

id	SEDICI_084a0a2d8c7e09393d2c59c69b61101e
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/114330
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de SeñasImage Generation with Deep Learning. Application on Sign Language RecognitionRíos, Gastón GustavoCiencias InformáticasSistemas inteligentes e IAVisión por computadoraRedes neuronalesAprendizaje automáticoArtificial intelligenceComputer visionArtificial neural networksMachine learningEl objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados.Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Tipo de investigación: AplicadaFacultad de InformáticaInstituto de Investigación en Informática2020-11-12info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaimage/pnghttp://sedici.unlp.edu.ar/handle/10915/114330spainfo:eu-repo/semantics/altIdentifier/url/https://congresos.unlp.edu.ar/ebec2020/gaston-gustavo-riosinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:20:44Zoai:sedici.unlp.edu.ar:10915/114330Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:20:44.775SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas Image Generation with Deep Learning. Application on Sign Language Recognition
title	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
spellingShingle	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas Ríos, Gastón Gustavo Ciencias Informáticas Sistemas inteligentes e IA Visión por computadora Redes neuronales Aprendizaje automático Artificial intelligence Computer vision Artificial neural networks Machine learning
title_short	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
title_full	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
title_fullStr	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
title_full_unstemmed	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
title_sort	Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas
dc.creator.none.fl_str_mv	Ríos, Gastón Gustavo
author	Ríos, Gastón Gustavo
author_facet	Ríos, Gastón Gustavo
author_role	author
dc.subject.none.fl_str_mv	Ciencias Informáticas Sistemas inteligentes e IA Visión por computadora Redes neuronales Aprendizaje automático Artificial intelligence Computer vision Artificial neural networks Machine learning
topic	Ciencias Informáticas Sistemas inteligentes e IA Visión por computadora Redes neuronales Aprendizaje automático Artificial intelligence Computer vision Artificial neural networks Machine learning
dc.description.none.fl_txt_mv	El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados. Carrera: Doctorado en Ciencias Informáticas Tipo de beca: Doctoral Año de inicio de beca: 2020 Año de finalización de beca: 2025 Organismo: UNLP Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Hasperué, Waldo Tipo de investigación: Aplicada Facultad de Informática Instituto de Investigación en Informática
description	El objetivo general de este plan de investigacion es el de crear modelos y técnicas de entrenamiento capaces de generar imágenes artificiales realistas y variadas en entornos con pocos datos etiquetados. Con estos modelos y técnicas de entrenamiento se facilitará el acceso a múltiples nuevas áreas de aplicación para modelos generativos. El énfasis estará puesto en la generación de imágenes de gestos de lengua de señas, permitiendo de esta forma entrenar modelos discriminadores precisos que utilicen aprendizaje profundo a partir de pocos datos etiquetados. Los objetivos son los siguientes: 1) Estudiar y analizar las bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas, y de grandes bases de datos de diversos dominios para ser utilizadas en las técnicas de entrenamiento. Particularmente LSA16 y LSA64, bases de datos para la Lengua de Señas Argentina desarrollada en el III-LIDI. 2) Crear nuevos modelos de generación de imágenes que posean coherencia semántica. Particularmente se estudiarán los autoencoders y las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte. 3) Crear nuevas técnicas de entrenamiento que permitan el entrenamiento de modelos generadores utilizando una cantidad de datos limitada. En particular se estudiarán transfer learning, data augmentation y aprendizaje semi supervisado. 4) Analizar y comparar los resultados obtenidos utilizando los modelos generativos y técnicas de entrenamiento desarrollados. Se usarán métricas comúnmente utilizadas en este tipo de problemas como Frechet Inception Distance (FID) e Inception Score (IS). Adicionalmente se realizarán evaluaciones semánticas para comprobar la variabilidad y coherencia de las imágenes generadas. 5) Desarrollar modelos clasificadores de imágenes aplicado al reconocimiento de gestos de la lengua de señas. Particularmente, se estudiarán Redes Neuronales Convolucionales (CNN) específicas para problemas de clasificación de objetos en imágenes. Aplicación, análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Con esta investigación se espera realizar un aporte significativo al estado del arte en cuanto a modelos generativos de imágenes artificiales y técnicas de entrenamiento. Particularmente se espera desarrollar modelos que permitan la generación de nuevas imágenes para gestos de la lengua de señas. Esto permitirá diversificar las bases de datos existentes, que suelen poseer pocos datos etiquetados. Esto podría ser aplicado en un futuro a otros dominios con datos etiquetados limitados.
publishDate	2020
dc.date.none.fl_str_mv	2020-11-12
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/114330
url	http://sedici.unlp.edu.ar/handle/10915/114330
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/https://congresos.unlp.edu.ar/ebec2020/gaston-gustavo-rios
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	image/png
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866371784672018432
score	13.343132

Generación de imágenes con técnicas de Aprendizaje Automático : Aplicaciones en Reconocimiento de Lengua de Señas

Publicaciones similares