pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva

Autores: Rostagno, Adrián; Iparraguirre, Javier; Friedrich, Guillermo Rodolfo; Aggio, Santiago; Briatore, Roberto; Tobio, Lucas; Coca, Diego
Año de publicación: 2025
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados.
Red de Universidades con Carreras en Informática
Materia: Ciencias Informáticas
self-supervised learning
ensemble learning
video classification
lightweight models
distributed computing
edge AI
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/191496

Acceder

id	SEDICI_70a80d3c454c313c4858d91e65414ae4
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/191496
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría ColectivaRostagno, AdriánIparraguirre, JavierFriedrich, Guillermo RodolfoAggio, SantiagoBriatore, RobertoTobio, LucasCoca, DiegoCiencias Informáticasself-supervised learningensemble learningvideo classificationlightweight modelsdistributed computingedge AIBasándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados.Red de Universidades con Carreras en Informática2025-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf135-144http://sedici.unlp.edu.ar/handle/10915/191496spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7info:eu-repo/semantics/reference/hdl/10915/189846info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:46:59Zoai:sedici.unlp.edu.ar:10915/191496Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:46:59.506SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
title	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
spellingShingle	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva Rostagno, Adrián Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI
title_short	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
title_full	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
title_fullStr	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
title_full_unstemmed	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
title_sort	pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
dc.creator.none.fl_str_mv	Rostagno, Adrián Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego
author	Rostagno, Adrián
author_facet	Rostagno, Adrián Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego
author_role	author
author2	Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego
author2_role	author author author author author author
dc.subject.none.fl_str_mv	Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI
topic	Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI
dc.description.none.fl_txt_mv	Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados. Red de Universidades con Carreras en Informática
description	Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados.
publishDate	2025
dc.date.none.fl_str_mv	2025-10
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/191496
url	http://sedici.unlp.edu.ar/handle/10915/191496
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7 info:eu-repo/semantics/reference/hdl/10915/189846
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 135-144
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866372196798038016
score	13.468849

pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva

Publicaciones similares