Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina

Autores
Dal Bianco, Pedro Alejandro
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión aceptada
Colaborador/a o director/a de tesis
Ronchetti, Franco
Quiroga, Facundo Manuel
Descripción
La Lengua de Señas Argentina (LSA) es fundamental para la comunicación y el acceso a la información de la comunidad sorda en Argentina. Sin embargo, la ausencia de traductores automáticos entre LSA y español limita la inclusión y la interacción efectiva con personas oyentes. Este trabajo aborda esta problemática mediante el desarrollo de recursos y modelos para la Traducción de Lengua de Señas (SLT) de LSA al español. En esta tesis se presenta LSA-T, el primer conjunto de datos continuo de LSA, que incluye más de 20 horas de video del canal de YouTube CN Sordos. Este conjunto de datos contiene traducciones al español y datos posicionales de los señantes, superando las limitaciones de bases de datos previas que solo incluían señas aisladas. LSA-T es esencial para entrenar modelos de SLT y abordar desafíos específicos de la traducción de lengua de señas. Además, se desarrolla Seni.ar, una aplicación diseñada para validar y ampliar LSA-T con la colaboración de expertos y la comunidad. Esta herramienta mejora la calidad y cantidad de datos disponibles, facilita la expansión continua de la base de datos y promueve la participación activa de la comunidad sorda y especialistas en LSA. Finalmente, se diseña y evalúa un modelo neuronal de SLT basado en información posicional, entrenado con LSA-T y validado en conjuntos de datos de otras lenguas de señas. Los resultados demuestran la viabilidad del enfoque y establecen una base para futuras investigaciones en traducción automática de LSA. Las contribuciones de este trabajo incluyen la creación de recursos fundamentales para el desarrollo de tecnologías de SLT en LSA y la implementación de modelos que sirven como referencia para investigaciones futuras. Estos avances buscan mejorar la comunicación y promover la inclusión de la comunidad sorda en Argentina.
Magister en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática
Materia
Informática
Redes Neuronales
Inteligencia artificial
Traducción de Lengua de Señas
Bases de Datos
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/183831

id SEDICI_4f6b829b40a427dcba7be2ceabcd7ad7
oai_identifier_str oai:sedici.unlp.edu.ar:10915/183831
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Desarrollo de recursos y modelos para la traducción de Lengua de Señas ArgentinaDal Bianco, Pedro AlejandroInformáticaRedes NeuronalesInteligencia artificialTraducción de Lengua de SeñasBases de DatosLa Lengua de Señas Argentina (LSA) es fundamental para la comunicación y el acceso a la información de la comunidad sorda en Argentina. Sin embargo, la ausencia de traductores automáticos entre LSA y español limita la inclusión y la interacción efectiva con personas oyentes. Este trabajo aborda esta problemática mediante el desarrollo de recursos y modelos para la Traducción de Lengua de Señas (SLT) de LSA al español. En esta tesis se presenta LSA-T, el primer conjunto de datos continuo de LSA, que incluye más de 20 horas de video del canal de YouTube CN Sordos. Este conjunto de datos contiene traducciones al español y datos posicionales de los señantes, superando las limitaciones de bases de datos previas que solo incluían señas aisladas. LSA-T es esencial para entrenar modelos de SLT y abordar desafíos específicos de la traducción de lengua de señas. Además, se desarrolla Seni.ar, una aplicación diseñada para validar y ampliar LSA-T con la colaboración de expertos y la comunidad. Esta herramienta mejora la calidad y cantidad de datos disponibles, facilita la expansión continua de la base de datos y promueve la participación activa de la comunidad sorda y especialistas en LSA. Finalmente, se diseña y evalúa un modelo neuronal de SLT basado en información posicional, entrenado con LSA-T y validado en conjuntos de datos de otras lenguas de señas. Los resultados demuestran la viabilidad del enfoque y establecen una base para futuras investigaciones en traducción automática de LSA. Las contribuciones de este trabajo incluyen la creación de recursos fundamentales para el desarrollo de tecnologías de SLT en LSA y la implementación de modelos que sirven como referencia para investigaciones futuras. Estos avances buscan mejorar la comunicación y promover la inclusión de la comunidad sorda en Argentina.Magister en Inteligencia de Datos orientada a Big DataUniversidad Nacional de La PlataFacultad de InformáticaRonchetti, FrancoQuiroga, Facundo Manuel2025-06-12info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTesis de maestriahttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/183831https://doi.org/10.35537/10915/183831spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:42:13Zoai:sedici.unlp.edu.ar:10915/183831Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:42:13.378SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
title Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
spellingShingle Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
Dal Bianco, Pedro Alejandro
Informática
Redes Neuronales
Inteligencia artificial
Traducción de Lengua de Señas
Bases de Datos
title_short Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
title_full Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
title_fullStr Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
title_full_unstemmed Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
title_sort Desarrollo de recursos y modelos para la traducción de Lengua de Señas Argentina
dc.creator.none.fl_str_mv Dal Bianco, Pedro Alejandro
author Dal Bianco, Pedro Alejandro
author_facet Dal Bianco, Pedro Alejandro
author_role author
dc.contributor.none.fl_str_mv Ronchetti, Franco
Quiroga, Facundo Manuel
dc.subject.none.fl_str_mv Informática
Redes Neuronales
Inteligencia artificial
Traducción de Lengua de Señas
Bases de Datos
topic Informática
Redes Neuronales
Inteligencia artificial
Traducción de Lengua de Señas
Bases de Datos
dc.description.none.fl_txt_mv La Lengua de Señas Argentina (LSA) es fundamental para la comunicación y el acceso a la información de la comunidad sorda en Argentina. Sin embargo, la ausencia de traductores automáticos entre LSA y español limita la inclusión y la interacción efectiva con personas oyentes. Este trabajo aborda esta problemática mediante el desarrollo de recursos y modelos para la Traducción de Lengua de Señas (SLT) de LSA al español. En esta tesis se presenta LSA-T, el primer conjunto de datos continuo de LSA, que incluye más de 20 horas de video del canal de YouTube CN Sordos. Este conjunto de datos contiene traducciones al español y datos posicionales de los señantes, superando las limitaciones de bases de datos previas que solo incluían señas aisladas. LSA-T es esencial para entrenar modelos de SLT y abordar desafíos específicos de la traducción de lengua de señas. Además, se desarrolla Seni.ar, una aplicación diseñada para validar y ampliar LSA-T con la colaboración de expertos y la comunidad. Esta herramienta mejora la calidad y cantidad de datos disponibles, facilita la expansión continua de la base de datos y promueve la participación activa de la comunidad sorda y especialistas en LSA. Finalmente, se diseña y evalúa un modelo neuronal de SLT basado en información posicional, entrenado con LSA-T y validado en conjuntos de datos de otras lenguas de señas. Los resultados demuestran la viabilidad del enfoque y establecen una base para futuras investigaciones en traducción automática de LSA. Las contribuciones de este trabajo incluyen la creación de recursos fundamentales para el desarrollo de tecnologías de SLT en LSA y la implementación de modelos que sirven como referencia para investigaciones futuras. Estos avances buscan mejorar la comunicación y promover la inclusión de la comunidad sorda en Argentina.
Magister en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática
description La Lengua de Señas Argentina (LSA) es fundamental para la comunicación y el acceso a la información de la comunidad sorda en Argentina. Sin embargo, la ausencia de traductores automáticos entre LSA y español limita la inclusión y la interacción efectiva con personas oyentes. Este trabajo aborda esta problemática mediante el desarrollo de recursos y modelos para la Traducción de Lengua de Señas (SLT) de LSA al español. En esta tesis se presenta LSA-T, el primer conjunto de datos continuo de LSA, que incluye más de 20 horas de video del canal de YouTube CN Sordos. Este conjunto de datos contiene traducciones al español y datos posicionales de los señantes, superando las limitaciones de bases de datos previas que solo incluían señas aisladas. LSA-T es esencial para entrenar modelos de SLT y abordar desafíos específicos de la traducción de lengua de señas. Además, se desarrolla Seni.ar, una aplicación diseñada para validar y ampliar LSA-T con la colaboración de expertos y la comunidad. Esta herramienta mejora la calidad y cantidad de datos disponibles, facilita la expansión continua de la base de datos y promueve la participación activa de la comunidad sorda y especialistas en LSA. Finalmente, se diseña y evalúa un modelo neuronal de SLT basado en información posicional, entrenado con LSA-T y validado en conjuntos de datos de otras lenguas de señas. Los resultados demuestran la viabilidad del enfoque y establecen una base para futuras investigaciones en traducción automática de LSA. Las contribuciones de este trabajo incluyen la creación de recursos fundamentales para el desarrollo de tecnologías de SLT en LSA y la implementación de modelos que sirven como referencia para investigaciones futuras. Estos avances buscan mejorar la comunicación y promover la inclusión de la comunidad sorda en Argentina.
publishDate 2025
dc.date.none.fl_str_mv 2025-06-12
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
Tesis de maestria
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/183831
https://doi.org/10.35537/10915/183831
url http://sedici.unlp.edu.ar/handle/10915/183831
https://doi.org/10.35537/10915/183831
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846064429365460992
score 13.22299