Estimación de movimiento en secuencias de imágenes RGB y RGB-D

Autores
Gómez Fernández, Francisco Roberto
Año de publicación
2016
Idioma
inglés
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Mejail, Marta Estela
Pardo Piccone, Alvaro D.
Descripción
El movimiento es una característica fundamental para el procesamientode video y sus posteriores aplicaciones. La estimación de movimientoen video es de gran utilidad para definir la correspondencia depuntos en una escena, calcular sus velocidades y así poder discriminar objetos,acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce comoestimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujoóptico minimizando la energía con graph cuts, en ambos casos considerandosecuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para lasegmentación de movimiento, y dentro de este contexto desarrollamos unaaplicación con características novedosas: (i) proceso de aprendizaje desacopladoy (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplarsecuencias de imágenes RGB-D, el cual no había sido estudiado hastael momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitososde performance y de clasificación para la mayoría de las casos. Luego,nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelopara aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordadomediante la minimización de la energía del campo de vectores utilizando latécnica de graph cuts con una formulación novedosa de la energía. Ampliamosesta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nuncase había utilizado graph cuts para estimar el scene flow. Los resultados obtenidossobre el dataset Middlebury muestran que nuestros algoritmos soncompetitivos comparados con los presentes en el estado del arte y los mejorescon en términos de error angular.
Motion is a fundamental cue for video processing and its furtherapplications. Video motion estimation is very useful to find correspondencesof points in a scene, computing their velocities, discriminate objects,actions, segment motion, etc. The aim of this work is to accurately track the motion of a large set ofpoints in videos. This is known as dense motion estimation. To this end,two main lines of study were proposed: statistical models of motion usingdynamic textures and optical flow calculation using graph cuts for energyminimization, considering in both cases sequences of RGB and RGB-D images. The dynamic textures model is well suited for motion segmentation,and in this context we develop an application with novel features: (i) a decoupledlearning step (ii) GPU-translated algorithms optimized to work on GPU (Graphic Process Unit). Also, the model has been extended to process RGB-D sequences, which had not been studied so far, allowing us to identifyvisual processes in 3D. Experiments on the Dyntex dataset show successfulresults of performance and classification for most cases. Then our analysisof RGB-D sequences reveal the viability of this model for 3D applications. The problem of optical flow estimation was addressed by minimizingthe energy of the vector field using the graph cuts method with a novel formulationof energy. We extend this formulation to take depth into accountand thus estimate the Scene Flow. To the best of our knowledge, scene flowestimation using graph cuts has never been used in the literature. The resultsobtained on the Middlebury dataset show that our algorithms are competitivewith the state of the art and the best performing in terms of angularerror.
Fil: Gómez Fernández, Francisco Roberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
ESTIMACION DE MOVIMIENTO
TEXTURAS DINAMICAS
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
MOTION ESTIMATION
DYNAMIC TEXTURES
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n5985_GomezFernandez

id BDUBAFCEN_3c5fed1b4203f493d417640b6e0ce811
oai_identifier_str tesis:tesis_n5985_GomezFernandez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Estimación de movimiento en secuencias de imágenes RGB y RGB-DMotion estimation in RGB and RGB-D image sequencesGómez Fernández, Francisco RobertoESTIMACION DE MOVIMIENTOTEXTURAS DINAMICASOPTICAL FLOWSCENE FLOWGRAPH CUTSMOTION ESTIMATIONDYNAMIC TEXTURESOPTICAL FLOWSCENE FLOWGRAPH CUTSEl movimiento es una característica fundamental para el procesamientode video y sus posteriores aplicaciones. La estimación de movimientoen video es de gran utilidad para definir la correspondencia depuntos en una escena, calcular sus velocidades y así poder discriminar objetos,acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce comoestimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujoóptico minimizando la energía con graph cuts, en ambos casos considerandosecuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para lasegmentación de movimiento, y dentro de este contexto desarrollamos unaaplicación con características novedosas: (i) proceso de aprendizaje desacopladoy (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplarsecuencias de imágenes RGB-D, el cual no había sido estudiado hastael momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitososde performance y de clasificación para la mayoría de las casos. Luego,nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelopara aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordadomediante la minimización de la energía del campo de vectores utilizando latécnica de graph cuts con una formulación novedosa de la energía. Ampliamosesta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nuncase había utilizado graph cuts para estimar el scene flow. Los resultados obtenidossobre el dataset Middlebury muestran que nuestros algoritmos soncompetitivos comparados con los presentes en el estado del arte y los mejorescon en términos de error angular.Motion is a fundamental cue for video processing and its furtherapplications. Video motion estimation is very useful to find correspondencesof points in a scene, computing their velocities, discriminate objects,actions, segment motion, etc. The aim of this work is to accurately track the motion of a large set ofpoints in videos. This is known as dense motion estimation. To this end,two main lines of study were proposed: statistical models of motion usingdynamic textures and optical flow calculation using graph cuts for energyminimization, considering in both cases sequences of RGB and RGB-D images. The dynamic textures model is well suited for motion segmentation,and in this context we develop an application with novel features: (i) a decoupledlearning step (ii) GPU-translated algorithms optimized to work on GPU (Graphic Process Unit). Also, the model has been extended to process RGB-D sequences, which had not been studied so far, allowing us to identifyvisual processes in 3D. Experiments on the Dyntex dataset show successfulresults of performance and classification for most cases. Then our analysisof RGB-D sequences reveal the viability of this model for 3D applications. The problem of optical flow estimation was addressed by minimizingthe energy of the vector field using the graph cuts method with a novel formulationof energy. We extend this formulation to take depth into accountand thus estimate the Scene Flow. To the best of our knowledge, scene flowestimation using graph cuts has never been used in the literature. The resultsobtained on the Middlebury dataset show that our algorithms are competitivewith the state of the art and the best performing in terms of angularerror.Fil: Gómez Fernández, Francisco Roberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMejail, Marta EstelaPardo Piccone, Alvaro D.2016-03-30info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n5985_GomezFernandezenginfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-23T11:17:49Ztesis:tesis_n5985_GomezFernandezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-23 11:17:50.064Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Estimación de movimiento en secuencias de imágenes RGB y RGB-D
Motion estimation in RGB and RGB-D image sequences
title Estimación de movimiento en secuencias de imágenes RGB y RGB-D
spellingShingle Estimación de movimiento en secuencias de imágenes RGB y RGB-D
Gómez Fernández, Francisco Roberto
ESTIMACION DE MOVIMIENTO
TEXTURAS DINAMICAS
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
MOTION ESTIMATION
DYNAMIC TEXTURES
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
title_short Estimación de movimiento en secuencias de imágenes RGB y RGB-D
title_full Estimación de movimiento en secuencias de imágenes RGB y RGB-D
title_fullStr Estimación de movimiento en secuencias de imágenes RGB y RGB-D
title_full_unstemmed Estimación de movimiento en secuencias de imágenes RGB y RGB-D
title_sort Estimación de movimiento en secuencias de imágenes RGB y RGB-D
dc.creator.none.fl_str_mv Gómez Fernández, Francisco Roberto
author Gómez Fernández, Francisco Roberto
author_facet Gómez Fernández, Francisco Roberto
author_role author
dc.contributor.none.fl_str_mv Mejail, Marta Estela
Pardo Piccone, Alvaro D.
dc.subject.none.fl_str_mv ESTIMACION DE MOVIMIENTO
TEXTURAS DINAMICAS
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
MOTION ESTIMATION
DYNAMIC TEXTURES
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
topic ESTIMACION DE MOVIMIENTO
TEXTURAS DINAMICAS
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
MOTION ESTIMATION
DYNAMIC TEXTURES
OPTICAL FLOW
SCENE FLOW
GRAPH CUTS
dc.description.none.fl_txt_mv El movimiento es una característica fundamental para el procesamientode video y sus posteriores aplicaciones. La estimación de movimientoen video es de gran utilidad para definir la correspondencia depuntos en una escena, calcular sus velocidades y así poder discriminar objetos,acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce comoestimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujoóptico minimizando la energía con graph cuts, en ambos casos considerandosecuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para lasegmentación de movimiento, y dentro de este contexto desarrollamos unaaplicación con características novedosas: (i) proceso de aprendizaje desacopladoy (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplarsecuencias de imágenes RGB-D, el cual no había sido estudiado hastael momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitososde performance y de clasificación para la mayoría de las casos. Luego,nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelopara aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordadomediante la minimización de la energía del campo de vectores utilizando latécnica de graph cuts con una formulación novedosa de la energía. Ampliamosesta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nuncase había utilizado graph cuts para estimar el scene flow. Los resultados obtenidossobre el dataset Middlebury muestran que nuestros algoritmos soncompetitivos comparados con los presentes en el estado del arte y los mejorescon en términos de error angular.
Motion is a fundamental cue for video processing and its furtherapplications. Video motion estimation is very useful to find correspondencesof points in a scene, computing their velocities, discriminate objects,actions, segment motion, etc. The aim of this work is to accurately track the motion of a large set ofpoints in videos. This is known as dense motion estimation. To this end,two main lines of study were proposed: statistical models of motion usingdynamic textures and optical flow calculation using graph cuts for energyminimization, considering in both cases sequences of RGB and RGB-D images. The dynamic textures model is well suited for motion segmentation,and in this context we develop an application with novel features: (i) a decoupledlearning step (ii) GPU-translated algorithms optimized to work on GPU (Graphic Process Unit). Also, the model has been extended to process RGB-D sequences, which had not been studied so far, allowing us to identifyvisual processes in 3D. Experiments on the Dyntex dataset show successfulresults of performance and classification for most cases. Then our analysisof RGB-D sequences reveal the viability of this model for 3D applications. The problem of optical flow estimation was addressed by minimizingthe energy of the vector field using the graph cuts method with a novel formulationof energy. We extend this formulation to take depth into accountand thus estimate the Scene Flow. To the best of our knowledge, scene flowestimation using graph cuts has never been used in the literature. The resultsobtained on the Middlebury dataset show that our algorithms are competitivewith the state of the art and the best performing in terms of angularerror.
Fil: Gómez Fernández, Francisco Roberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El movimiento es una característica fundamental para el procesamientode video y sus posteriores aplicaciones. La estimación de movimientoen video es de gran utilidad para definir la correspondencia depuntos en una escena, calcular sus velocidades y así poder discriminar objetos,acciones, segmentar movimiento, etc. El objetivo de este trabajo es realizar un seguimiento preciso y una estimación de movimiento de un gran conjunto de puntos. Esto se conoce comoestimación densa de movimiento. Para ello, se proponen dos líneas principales de estudio: modelos estadísticos de movimiento utilizando texturas dinámicas y el cálculo del flujoóptico minimizando la energía con graph cuts, en ambos casos considerandosecuencias de imágenes RGB y RGB-D. El modelo de texturas dinámicas está muy bien condicionado para lasegmentación de movimiento, y dentro de este contexto desarrollamos unaaplicación con características novedosas: (i) proceso de aprendizaje desacopladoy (ii) algoritmos optimizados para trabajar en placas gráficas GPU (Graphic Process Unit). Además, el modelo ha sido extendido para contemplarsecuencias de imágenes RGB-D, el cual no había sido estudiado hastael momento, permitiéndonos identificar procesos visuales en 3D. Experimentos sobre la base de datos DynTex muestran resultados exitososde performance y de clasificación para la mayoría de las casos. Luego,nuestros análisis sobre secuencias RGB-D revelan la viabilidad de este modelopara aplicaciones 3D. El problema de la estimación del flujo óptico (optical flow) fue abordadomediante la minimización de la energía del campo de vectores utilizando latécnica de graph cuts con una formulación novedosa de la energía. Ampliamosesta formulación para tener en cuenta la profundidad y así calcular el flujo de la escena (scene flow). Hasta donde sabemos, en la literatura, nuncase había utilizado graph cuts para estimar el scene flow. Los resultados obtenidossobre el dataset Middlebury muestran que nuestros algoritmos soncompetitivos comparados con los presentes en el estado del arte y los mejorescon en términos de error angular.
publishDate 2016
dc.date.none.fl_str_mv 2016-03-30
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n5985_GomezFernandez
url https://hdl.handle.net/20.500.12110/tesis_n5985_GomezFernandez
dc.language.none.fl_str_mv eng
language eng
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1846784867469099008
score 12.982451