Técnicas embedding para clasificación de imágenes en grandes bancos de datos

Autores
Bustos, Maximiliano David
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Sánchez, Jorge Adrián, dir.
Descripción
En este trabajo se considera el problema de clasificación de imágenes en gran escala mediante embeddings lineales. En un modelo embedding, además de generar una representación para las imágenes (entradas) se genera una representación para las clases o conceptos de interés (salidas). De esta forma, al comparar estas representaciones intermedias (imágenes y clases) en un espacio de representación común, es posible abordar de manera unificada problemas como los de clasificación y búsqueda de imágenes por contenido. Los métodos embedding son particularmente atractivos en cuanto permiten generar proyecciones a espacios de imensionalidad reducida, lo que hace posible el abordaje de problemas en gran escala (millones de imágenes, cientos de miles de conceptos) de manera eficiente. En particular, se analiza el algoritmo WSABIE propuesto por [Weston et al.,2011b] el cual, a diferencia de los esquemas tradicionales, aborda el problema de aprendizaje mediante la optimización de una función objetivo que tiene en cuenta no solo si una muestra fue bien o mal clasificada, sino cómo se ubicó su etiqueta verdadera respecto de las k mejores predicciones en una lista ordenada de posibles anotaciones.
In this work we consider the problem of large scale image classification using linear embeddings. In an embedding model, a representation of both images (inputs) and classes (outputs) is generated. Then, by comparing these intermediate representations (images and classes) in a common representation space, it is possible to solve problems like classification and image retrieval in a unified manner. Embedding methods are attractive because they allow the projection into spaces of low dimensionality where large scale problems (millions of images and hundreds of thousands of concepts) can be handled efficiently. In particular, we analyze the WSABIE algorithm proposed by [Weston et al., 2011b] which, unlike traditional methods, approaches the learning problem through the optimization of an objective function that considers not only whether the sample was correctly classified, but also the rank of the true label with respect to the k best predictions in a sorted list of possible annotations.
Materia
Pattern recognition
Visión por computadora
Aprendizaje automático
Optimización estocástica
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/2827

id RDUUNC_c072449914b528ffa39485a4ae5d8a85
oai_identifier_str oai:rdu.unc.edu.ar:11086/2827
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Técnicas embedding para clasificación de imágenes en grandes bancos de datosBustos, Maximiliano DavidPattern recognitionVisión por computadoraAprendizaje automáticoOptimización estocásticaEn este trabajo se considera el problema de clasificación de imágenes en gran escala mediante embeddings lineales. En un modelo embedding, además de generar una representación para las imágenes (entradas) se genera una representación para las clases o conceptos de interés (salidas). De esta forma, al comparar estas representaciones intermedias (imágenes y clases) en un espacio de representación común, es posible abordar de manera unificada problemas como los de clasificación y búsqueda de imágenes por contenido. Los métodos embedding son particularmente atractivos en cuanto permiten generar proyecciones a espacios de imensionalidad reducida, lo que hace posible el abordaje de problemas en gran escala (millones de imágenes, cientos de miles de conceptos) de manera eficiente. En particular, se analiza el algoritmo WSABIE propuesto por [Weston et al.,2011b] el cual, a diferencia de los esquemas tradicionales, aborda el problema de aprendizaje mediante la optimización de una función objetivo que tiene en cuenta no solo si una muestra fue bien o mal clasificada, sino cómo se ubicó su etiqueta verdadera respecto de las k mejores predicciones en una lista ordenada de posibles anotaciones.In this work we consider the problem of large scale image classification using linear embeddings. In an embedding model, a representation of both images (inputs) and classes (outputs) is generated. Then, by comparing these intermediate representations (images and classes) in a common representation space, it is possible to solve problems like classification and image retrieval in a unified manner. Embedding methods are attractive because they allow the projection into spaces of low dimensionality where large scale problems (millions of images and hundreds of thousands of concepts) can be handled efficiently. In particular, we analyze the WSABIE algorithm proposed by [Weston et al., 2011b] which, unlike traditional methods, approaches the learning problem through the optimization of an objective function that considers not only whether the sample was correctly classified, but also the rank of the true label with respect to the k best predictions in a sorted list of possible annotations.Sánchez, Jorge Adrián, dir.2015-08-06info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/2827spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-10-16T09:30:24Zoai:rdu.unc.edu.ar:11086/2827Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-10-16 09:30:25.01Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Técnicas embedding para clasificación de imágenes en grandes bancos de datos
title Técnicas embedding para clasificación de imágenes en grandes bancos de datos
spellingShingle Técnicas embedding para clasificación de imágenes en grandes bancos de datos
Bustos, Maximiliano David
Pattern recognition
Visión por computadora
Aprendizaje automático
Optimización estocástica
title_short Técnicas embedding para clasificación de imágenes en grandes bancos de datos
title_full Técnicas embedding para clasificación de imágenes en grandes bancos de datos
title_fullStr Técnicas embedding para clasificación de imágenes en grandes bancos de datos
title_full_unstemmed Técnicas embedding para clasificación de imágenes en grandes bancos de datos
title_sort Técnicas embedding para clasificación de imágenes en grandes bancos de datos
dc.creator.none.fl_str_mv Bustos, Maximiliano David
author Bustos, Maximiliano David
author_facet Bustos, Maximiliano David
author_role author
dc.contributor.none.fl_str_mv Sánchez, Jorge Adrián, dir.
dc.subject.none.fl_str_mv Pattern recognition
Visión por computadora
Aprendizaje automático
Optimización estocástica
topic Pattern recognition
Visión por computadora
Aprendizaje automático
Optimización estocástica
dc.description.none.fl_txt_mv En este trabajo se considera el problema de clasificación de imágenes en gran escala mediante embeddings lineales. En un modelo embedding, además de generar una representación para las imágenes (entradas) se genera una representación para las clases o conceptos de interés (salidas). De esta forma, al comparar estas representaciones intermedias (imágenes y clases) en un espacio de representación común, es posible abordar de manera unificada problemas como los de clasificación y búsqueda de imágenes por contenido. Los métodos embedding son particularmente atractivos en cuanto permiten generar proyecciones a espacios de imensionalidad reducida, lo que hace posible el abordaje de problemas en gran escala (millones de imágenes, cientos de miles de conceptos) de manera eficiente. En particular, se analiza el algoritmo WSABIE propuesto por [Weston et al.,2011b] el cual, a diferencia de los esquemas tradicionales, aborda el problema de aprendizaje mediante la optimización de una función objetivo que tiene en cuenta no solo si una muestra fue bien o mal clasificada, sino cómo se ubicó su etiqueta verdadera respecto de las k mejores predicciones en una lista ordenada de posibles anotaciones.
In this work we consider the problem of large scale image classification using linear embeddings. In an embedding model, a representation of both images (inputs) and classes (outputs) is generated. Then, by comparing these intermediate representations (images and classes) in a common representation space, it is possible to solve problems like classification and image retrieval in a unified manner. Embedding methods are attractive because they allow the projection into spaces of low dimensionality where large scale problems (millions of images and hundreds of thousands of concepts) can be handled efficiently. In particular, we analyze the WSABIE algorithm proposed by [Weston et al., 2011b] which, unlike traditional methods, approaches the learning problem through the optimization of an objective function that considers not only whether the sample was correctly classified, but also the rank of the true label with respect to the k best predictions in a sorted list of possible annotations.
description En este trabajo se considera el problema de clasificación de imágenes en gran escala mediante embeddings lineales. En un modelo embedding, además de generar una representación para las imágenes (entradas) se genera una representación para las clases o conceptos de interés (salidas). De esta forma, al comparar estas representaciones intermedias (imágenes y clases) en un espacio de representación común, es posible abordar de manera unificada problemas como los de clasificación y búsqueda de imágenes por contenido. Los métodos embedding son particularmente atractivos en cuanto permiten generar proyecciones a espacios de imensionalidad reducida, lo que hace posible el abordaje de problemas en gran escala (millones de imágenes, cientos de miles de conceptos) de manera eficiente. En particular, se analiza el algoritmo WSABIE propuesto por [Weston et al.,2011b] el cual, a diferencia de los esquemas tradicionales, aborda el problema de aprendizaje mediante la optimización de una función objetivo que tiene en cuenta no solo si una muestra fue bien o mal clasificada, sino cómo se ubicó su etiqueta verdadera respecto de las k mejores predicciones en una lista ordenada de posibles anotaciones.
publishDate 2015
dc.date.none.fl_str_mv 2015-08-06
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/2827
url http://hdl.handle.net/11086/2827
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1846143381591293952
score 12.712165