P-DIndex: Optimizando las búsquedas sobre espacios métricos

Autores
Gil Costa, Graciela Verónica; Perez, Norma; Reyes, Nora Susana
Año de publicación
2008
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Para reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida que crece la complejidad de los tipos de datos modernos los espacios métricos obtienen mayor popularidad como paradigma de recuperación de información. Un índice propuesto recientemente es el D-Index el cual es una estructura de múltiples niveles que permite dividir recursivamente los objetos del espacio métrico en conjuntos separables. Este índice combina técnicas de clustering y técnicas basadas en pivotes para realizar las búsquedas por similitud. Por otro lado, la resolución de consultas sobre este tipo de índices tiende a ser muy costosa por la dificultad que implica la ejecución de la función de similitud, la cual depende del tipo de objeto multimedial utilizado (video, sonido, imagen, etc.). La computación paralela es un paradigma que permite reducir los tiempos de ejecución de los algoritmos. Existen dos escuelas referentes a la comunicación en un diseño paralelo: síncrona y asíncrona. En particular en este trabajo utilizamos el modelo de computación paralela síncrono Bulk-Synchronous Parallel - BSP que provee un modelo de costo sencillo que permite predecir los tiempos de ejecución de los algoritmos paralelos.
Eje: Procesamiento Concurrente, Paralelo y Distribuido
Red de Universidades con Carreras en Informática (RedUNCI)
Materia
Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/20650

id SEDICI_6b948fd30d5549183322e7fd7b02a8fe
oai_identifier_str oai:sedici.unlp.edu.ar:10915/20650
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling P-DIndex: Optimizando las búsquedas sobre espacios métricosGil Costa, Graciela VerónicaPerez, NormaReyes, Nora SusanaCiencias Informáticasespacios métricosParallelbúsqueda por similitudDistributedPara reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida que crece la complejidad de los tipos de datos modernos los espacios métricos obtienen mayor popularidad como paradigma de recuperación de información. Un índice propuesto recientemente es el D-Index el cual es una estructura de múltiples niveles que permite dividir recursivamente los objetos del espacio métrico en conjuntos separables. Este índice combina técnicas de clustering y técnicas basadas en pivotes para realizar las búsquedas por similitud. Por otro lado, la resolución de consultas sobre este tipo de índices tiende a ser muy costosa por la dificultad que implica la ejecución de la función de similitud, la cual depende del tipo de objeto multimedial utilizado (video, sonido, imagen, etc.). La computación paralela es un paradigma que permite reducir los tiempos de ejecución de los algoritmos. Existen dos escuelas referentes a la comunicación en un diseño paralelo: síncrona y asíncrona. En particular en este trabajo utilizamos el modelo de computación paralela síncrono Bulk-Synchronous Parallel - BSP que provee un modelo de costo sencillo que permite predecir los tiempos de ejecución de los algoritmos paralelos.Eje: Procesamiento Concurrente, Paralelo y DistribuidoRed de Universidades con Carreras en Informática (RedUNCI)2008-05info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf608-612http://sedici.unlp.edu.ar/handle/10915/20650spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T10:54:20Zoai:sedici.unlp.edu.ar:10915/20650Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 10:54:20.644SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv P-DIndex: Optimizando las búsquedas sobre espacios métricos
title P-DIndex: Optimizando las búsquedas sobre espacios métricos
spellingShingle P-DIndex: Optimizando las búsquedas sobre espacios métricos
Gil Costa, Graciela Verónica
Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
title_short P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_full P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_fullStr P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_full_unstemmed P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_sort P-DIndex: Optimizando las búsquedas sobre espacios métricos
dc.creator.none.fl_str_mv Gil Costa, Graciela Verónica
Perez, Norma
Reyes, Nora Susana
author Gil Costa, Graciela Verónica
author_facet Gil Costa, Graciela Verónica
Perez, Norma
Reyes, Nora Susana
author_role author
author2 Perez, Norma
Reyes, Nora Susana
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
topic Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
dc.description.none.fl_txt_mv Para reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida que crece la complejidad de los tipos de datos modernos los espacios métricos obtienen mayor popularidad como paradigma de recuperación de información. Un índice propuesto recientemente es el D-Index el cual es una estructura de múltiples niveles que permite dividir recursivamente los objetos del espacio métrico en conjuntos separables. Este índice combina técnicas de clustering y técnicas basadas en pivotes para realizar las búsquedas por similitud. Por otro lado, la resolución de consultas sobre este tipo de índices tiende a ser muy costosa por la dificultad que implica la ejecución de la función de similitud, la cual depende del tipo de objeto multimedial utilizado (video, sonido, imagen, etc.). La computación paralela es un paradigma que permite reducir los tiempos de ejecución de los algoritmos. Existen dos escuelas referentes a la comunicación en un diseño paralelo: síncrona y asíncrona. En particular en este trabajo utilizamos el modelo de computación paralela síncrono Bulk-Synchronous Parallel - BSP que provee un modelo de costo sencillo que permite predecir los tiempos de ejecución de los algoritmos paralelos.
Eje: Procesamiento Concurrente, Paralelo y Distribuido
Red de Universidades con Carreras en Informática (RedUNCI)
description Para reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida que crece la complejidad de los tipos de datos modernos los espacios métricos obtienen mayor popularidad como paradigma de recuperación de información. Un índice propuesto recientemente es el D-Index el cual es una estructura de múltiples niveles que permite dividir recursivamente los objetos del espacio métrico en conjuntos separables. Este índice combina técnicas de clustering y técnicas basadas en pivotes para realizar las búsquedas por similitud. Por otro lado, la resolución de consultas sobre este tipo de índices tiende a ser muy costosa por la dificultad que implica la ejecución de la función de similitud, la cual depende del tipo de objeto multimedial utilizado (video, sonido, imagen, etc.). La computación paralela es un paradigma que permite reducir los tiempos de ejecución de los algoritmos. Existen dos escuelas referentes a la comunicación en un diseño paralelo: síncrona y asíncrona. En particular en este trabajo utilizamos el modelo de computación paralela síncrono Bulk-Synchronous Parallel - BSP que provee un modelo de costo sencillo que permite predecir los tiempos de ejecución de los algoritmos paralelos.
publishDate 2008
dc.date.none.fl_str_mv 2008-05
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/20650
url http://sedici.unlp.edu.ar/handle/10915/20650
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
dc.format.none.fl_str_mv application/pdf
608-612
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844615800445468672
score 13.070432