pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva
- Autores
- Rostagno, Adrián; Iparraguirre, Javier; Friedrich, Guillermo Rodolfo; Aggio, Santiago; Briatore, Roberto; Tobio, Lucas; Coca, Diego
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
self-supervised learning
ensemble learning
video classification
lightweight models
distributed computing
edge AI - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/191496
Ver los metadatos del registro completo
| id |
SEDICI_70a80d3c454c313c4858d91e65414ae4 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/191496 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría ColectivaRostagno, AdriánIparraguirre, JavierFriedrich, Guillermo RodolfoAggio, SantiagoBriatore, RobertoTobio, LucasCoca, DiegoCiencias Informáticasself-supervised learningensemble learningvideo classificationlightweight modelsdistributed computingedge AIBasándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados.Red de Universidades con Carreras en Informática2025-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf135-144http://sedici.unlp.edu.ar/handle/10915/191496spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7info:eu-repo/semantics/reference/hdl/10915/189846info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-04-23T11:55:30Zoai:sedici.unlp.edu.ar:10915/191496Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-04-23 11:55:31.027SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| title |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| spellingShingle |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva Rostagno, Adrián Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI |
| title_short |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| title_full |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| title_fullStr |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| title_full_unstemmed |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| title_sort |
pico-JEPA: Comprendiendo el Video con Modelos Ultra-Ligeros y la Sabiduría Colectiva |
| dc.creator.none.fl_str_mv |
Rostagno, Adrián Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego |
| author |
Rostagno, Adrián |
| author_facet |
Rostagno, Adrián Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego |
| author_role |
author |
| author2 |
Iparraguirre, Javier Friedrich, Guillermo Rodolfo Aggio, Santiago Briatore, Roberto Tobio, Lucas Coca, Diego |
| author2_role |
author author author author author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI |
| topic |
Ciencias Informáticas self-supervised learning ensemble learning video classification lightweight models distributed computing edge AI |
| dc.description.none.fl_txt_mv |
Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados. Red de Universidades con Carreras en Informática |
| description |
Basándose en nuestro trabajo previo con nano-JEPA, presentamos pico-JEPA, una adaptación ultraligera de la Joint Embedding Predictive Architecture (JEPA) diseñada para dispositivos con recursos significativamente limitados. Mientras que nano-JEPA demostró la viabilidad de entrenar modelos tipo V-JEPA en ordenadores personales, pico-JEPA va más allá al crear modelos lo suficientemente pequeños como para permitir arquitecturas de conjuntos a través de mecanismos de votación colaborativa. Presentamos un marco integral donde múltiples modelos pico-JEPA, cada uno entrenado en diferentes subconjuntos de datos o con configuraciones arquitectónicas variadas, resuelven colectivamente tareas de clasificación de video mediante estrategias de votación inteligentes. Nuestro enfoque aborda el compromiso fundamental entre el tamaño del modelo y el rendimiento,aprovechando el principio de la sabiduría de las multitudes en el aprendizaje profundo. Los resultados experimentales obtenidos sobre el conjunto de datos Kinetics-700, demuestran que 4 modelos pico-JEPA pueden lograr un rendimiento competitivo, en comparación con modelos únicos, manteniendo la capacidad de ejecutarse en hardware estándar. Este trabajo abre nuevas posibilidades para la comprensión de video distribuida en escenarios de computación de borde y proporciona un camino para el aprendizaje colaborativo en entornos con recursos limitados. Finalmente, el proyecto se publica en un repositorio abierto con el fin de acelerar la colaboración entre investigadores interesados. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-10 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/191496 |
| url |
http://sedici.unlp.edu.ar/handle/10915/191496 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7 info:eu-repo/semantics/reference/hdl/10915/189846 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 135-144 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1863367876156588032 |
| score |
12.586656 |