Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
- Autores
- Feldman, Mateo; Kamienkowski, Juan E.; Ruarte, Gonzalo
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.
Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model approximate human variability in most cases.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
Búsqueda visual
Ruido
Variabilidad humana
Visual search
Noise
Human variability - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/190561
Ver los metadatos del registro completo
| id |
SEDICI_4a9d2754a8b6386336ff07873bec50e2 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/190561 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humanaVisual search on natural images: Incorporating noise as a model of human variabilityFeldman, MateoKamienkowski, Juan E.Ruarte, GonzaloCiencias InformáticasBúsqueda visualRuidoVariabilidad humanaVisual searchNoiseHuman variabilityLa búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model approximate human variability in most cases.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf113-118http://sedici.unlp.edu.ar/handle/10915/190561spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19768info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-13T12:58:43Zoai:sedici.unlp.edu.ar:10915/190561Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-13 12:58:43.656SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana Visual search on natural images: Incorporating noise as a model of human variability |
| title |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| spellingShingle |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana Feldman, Mateo Ciencias Informáticas Búsqueda visual Ruido Variabilidad humana Visual search Noise Human variability |
| title_short |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| title_full |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| title_fullStr |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| title_full_unstemmed |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| title_sort |
Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana |
| dc.creator.none.fl_str_mv |
Feldman, Mateo Kamienkowski, Juan E. Ruarte, Gonzalo |
| author |
Feldman, Mateo |
| author_facet |
Feldman, Mateo Kamienkowski, Juan E. Ruarte, Gonzalo |
| author_role |
author |
| author2 |
Kamienkowski, Juan E. Ruarte, Gonzalo |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Búsqueda visual Ruido Variabilidad humana Visual search Noise Human variability |
| topic |
Ciencias Informáticas Búsqueda visual Ruido Variabilidad humana Visual search Noise Human variability |
| dc.description.none.fl_txt_mv |
La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana. Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model approximate human variability in most cases. Sociedad Argentina de Informática e Investigación Operativa |
| description |
La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/190561 |
| url |
http://sedici.unlp.edu.ar/handle/10915/190561 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19768 info:eu-repo/semantics/altIdentifier/issn/2451-7496 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 113-118 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1865172474087342080 |
| score |
13.115601 |