Métodos de paginación paraíndices métricos basados en pivotes
- Autores
- Villegas, Ana; Chávez, Edgar; Herrera, Norma Edith
- Año de publicación
- 2004
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.
Eje: I - Workshop de Ingeniería de Software y Base de Datos
Red de Universidades con Carreras en Informática (RedUNCI) - Materia
-
Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/22287
Ver los metadatos del registro completo
id |
SEDICI_20c76e23991e025f8c1c91ecaa7cb31d |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/22287 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Métodos de paginación paraíndices métricos basados en pivotesVillegas, AnaChávez, EdgarHerrera, Norma EdithCiencias InformáticasBúsquedas por Similitudbase de datosSOFTWARE ENGINEERINGÍndicesMetricsMemoria SecundariaEl problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.Eje: I - Workshop de Ingeniería de Software y Base de DatosRed de Universidades con Carreras en Informática (RedUNCI)2004info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/22287spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T10:54:57Zoai:sedici.unlp.edu.ar:10915/22287Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 10:54:58.221SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Métodos de paginación paraíndices métricos basados en pivotes |
title |
Métodos de paginación paraíndices métricos basados en pivotes |
spellingShingle |
Métodos de paginación paraíndices métricos basados en pivotes Villegas, Ana Ciencias Informáticas Búsquedas por Similitud base de datos SOFTWARE ENGINEERING Índices Metrics Memoria Secundaria |
title_short |
Métodos de paginación paraíndices métricos basados en pivotes |
title_full |
Métodos de paginación paraíndices métricos basados en pivotes |
title_fullStr |
Métodos de paginación paraíndices métricos basados en pivotes |
title_full_unstemmed |
Métodos de paginación paraíndices métricos basados en pivotes |
title_sort |
Métodos de paginación paraíndices métricos basados en pivotes |
dc.creator.none.fl_str_mv |
Villegas, Ana Chávez, Edgar Herrera, Norma Edith |
author |
Villegas, Ana |
author_facet |
Villegas, Ana Chávez, Edgar Herrera, Norma Edith |
author_role |
author |
author2 |
Chávez, Edgar Herrera, Norma Edith |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Búsquedas por Similitud base de datos SOFTWARE ENGINEERING Índices Metrics Memoria Secundaria |
topic |
Ciencias Informáticas Búsquedas por Similitud base de datos SOFTWARE ENGINEERING Índices Metrics Memoria Secundaria |
dc.description.none.fl_txt_mv |
El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria. Eje: I - Workshop de Ingeniería de Software y Base de Datos Red de Universidades con Carreras en Informática (RedUNCI) |
description |
El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria. |
publishDate |
2004 |
dc.date.none.fl_str_mv |
2004 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/22287 |
url |
http://sedici.unlp.edu.ar/handle/10915/22287 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844615808275185664 |
score |
13.069144 |