Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana

Autores
Feldman, Mateo; Kamienkowski, Juan E.; Ruarte, Gonzalo
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.
Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model  approximate human variability in most cases.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Búsqueda visual
Ruido
Variabilidad humana
Visual search
Noise
Human variability
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/190561

id SEDICI_4a9d2754a8b6386336ff07873bec50e2
oai_identifier_str oai:sedici.unlp.edu.ar:10915/190561
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humanaVisual search on natural images: Incorporating noise as a model of human variabilityFeldman, MateoKamienkowski, Juan E.Ruarte, GonzaloCiencias InformáticasBúsqueda visualRuidoVariabilidad humanaVisual searchNoiseHuman variabilityLa búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model  approximate human variability in most cases.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf113-118http://sedici.unlp.edu.ar/handle/10915/190561spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19768info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-13T12:58:43Zoai:sedici.unlp.edu.ar:10915/190561Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-13 12:58:43.656SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
Visual search on natural images: Incorporating noise as a model of human variability
title Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
spellingShingle Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
Feldman, Mateo
Ciencias Informáticas
Búsqueda visual
Ruido
Variabilidad humana
Visual search
Noise
Human variability
title_short Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
title_full Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
title_fullStr Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
title_full_unstemmed Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
title_sort Búsqueda visual sobre imágenes naturales: incorporando ruido como modelado de la variabilidad humana
dc.creator.none.fl_str_mv Feldman, Mateo
Kamienkowski, Juan E.
Ruarte, Gonzalo
author Feldman, Mateo
author_facet Feldman, Mateo
Kamienkowski, Juan E.
Ruarte, Gonzalo
author_role author
author2 Kamienkowski, Juan E.
Ruarte, Gonzalo
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Búsqueda visual
Ruido
Variabilidad humana
Visual search
Noise
Human variability
topic Ciencias Informáticas
Búsqueda visual
Ruido
Variabilidad humana
Visual search
Noise
Human variability
dc.description.none.fl_txt_mv La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.
Visual search is crucial in daily human interaction with the environment, involving sequential eye movements. Computational models attempt to replicate this behavior by mimicking cognitive mechanisms used during natural image perception. Despite advances in neuroscience, visual search remains complex and not fully characterized. One key aspect of human cognition often overlooked is the role of noise, particularly in exploration and decision-making. Different sources of noise cause variability in response times, provoke mistakes, and may also explain individual differences between participants. We propose a modified version of the Entropy Limit Minimization (ELM) model to better capture human variability in visual search. Although deterministic, our model introduces randomness through seeds derived from both the input image and the participant. We explore several noise injection strategies to the model, including adding noise to the image prior, the information gain map, and the overshooting of saccades via random offsets. To evaluate variability, we use metrics from the VISIONS benchmark, repeating model runs with different seeds. Notably, adding noise in the prior of the model yielded the closest approximation to human variability. However, the results show that adding different types of noise helps the model  approximate human variability in most cases.
Sociedad Argentina de Informática e Investigación Operativa
description La búsqueda visual es fundamental en la interacción cotidiana entre los humanos y su entorno que involucra movimientos oculares secuenciales. Diversos modelos computacionales intentan emular este comportamiento imitando los mecanismos cognitivos involucrados en la percepción de imágenes naturales. A pesar de los avances en neurociencia, la búsqueda visual sigue siendo un proceso complejo y no completamente caracterizado. Un aspecto clave de la cognición humana que suele pasarse por alto es el papel del ruido, especialmente en tareas de exploración y toma de decisiones. Distintas fuentes de ruido generan variabilidad en los tiempos de respuesta, provocan errores y podrían explicar diferencias individuales entre participantes. En este trabajo proponemos una versión modificada del modelo Entropy Limit Minimization (ELM) que, si bien es determinista, introduce aleatoriedad mediante semillas derivadas tanto de la imagen de entrada como del participante para capturar mejor dicha variabilidad humana. Exploramos distintas estrategias de inyección de ruido, incluyendo agregado de ruido a la prior de la imagen, al mapa de ganancia de información y al desplazamiento aleatorio de las fijaciones. La evaluación con métricas del benchmark VISIONS mostró que alterar el prior fue la estrategia que más se acercó a la variabilidad humana.
publishDate 2025
dc.date.none.fl_str_mv 2025-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/190561
url http://sedici.unlp.edu.ar/handle/10915/190561
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19768
info:eu-repo/semantics/altIdentifier/issn/2451-7496
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
113-118
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1865172474087342080
score 13.115601