Métodos de paginación paraíndices métricos basados en pivotes

Autores
Villegas, Ana; Chávez, Edgar; Herrera, Norma Edith
Año de publicación
2004
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.
Eje: I - Workshop de Ingeniería de Software y Base de Datos
Red de Universidades con Carreras en Informática (RedUNCI)
Materia
Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/22287

id SEDICI_20c76e23991e025f8c1c91ecaa7cb31d
oai_identifier_str oai:sedici.unlp.edu.ar:10915/22287
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Métodos de paginación paraíndices métricos basados en pivotesVillegas, AnaChávez, EdgarHerrera, Norma EdithCiencias InformáticasBúsquedas por Similitudbase de datosSOFTWARE ENGINEERINGÍndicesMetricsMemoria SecundariaEl problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.Eje: I - Workshop de Ingeniería de Software y Base de DatosRed de Universidades con Carreras en Informática (RedUNCI)2004info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/22287spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T10:54:57Zoai:sedici.unlp.edu.ar:10915/22287Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 10:54:58.221SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Métodos de paginación paraíndices métricos basados en pivotes
title Métodos de paginación paraíndices métricos basados en pivotes
spellingShingle Métodos de paginación paraíndices métricos basados en pivotes
Villegas, Ana
Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
title_short Métodos de paginación paraíndices métricos basados en pivotes
title_full Métodos de paginación paraíndices métricos basados en pivotes
title_fullStr Métodos de paginación paraíndices métricos basados en pivotes
title_full_unstemmed Métodos de paginación paraíndices métricos basados en pivotes
title_sort Métodos de paginación paraíndices métricos basados en pivotes
dc.creator.none.fl_str_mv Villegas, Ana
Chávez, Edgar
Herrera, Norma Edith
author Villegas, Ana
author_facet Villegas, Ana
Chávez, Edgar
Herrera, Norma Edith
author_role author
author2 Chávez, Edgar
Herrera, Norma Edith
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
topic Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
dc.description.none.fl_txt_mv El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.
Eje: I - Workshop de Ingeniería de Software y Base de Datos
Red de Universidades con Carreras en Informática (RedUNCI)
description El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.
publishDate 2004
dc.date.none.fl_str_mv 2004
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/22287
url http://sedici.unlp.edu.ar/handle/10915/22287
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844615808275185664
score 13.069144