Indexando bases de datos de texto
- Autores
- Herrera, Norma Edith; Ruano, Carina; Ruano, Darío; Esquivel, Susana Cecilia
- Año de publicación
- 2015
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Uno de los principales problemas al que nos enfrentamos al indexar una base de datos de texto es que el índice ocupa mas espacio que el texto a indexar, pudiendo alcanzar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado por el índice es buscar una representación compacta del mismo. Pero en grandes colecciones de texto, el índice aun comprimido suele ser demasiado grande como para residir en memoria principal. En estos casos, la cantidad de accesos a discos realizados durante el procesamiento de una consulta resulta crítica para la performance del índice. Nuestro ámbito de investigación es el estudio de índices comprimidos y en memoria secundaria para búsquedas en texto.
Eje: Base de Datos y Minería de Datos
Red de Universidades con Carreras en Informática (RedUNCI) - Materia
-
Ciencias Informáticas
base de datos
indezación - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/45609
Ver los metadatos del registro completo
id |
SEDICI_ab6c31e61cfeda1e819eb0d98f4a6c01 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/45609 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Indexando bases de datos de textoHerrera, Norma EdithRuano, CarinaRuano, DaríoEsquivel, Susana CeciliaCiencias Informáticasbase de datosindezaciónUno de los principales problemas al que nos enfrentamos al indexar una base de datos de texto es que el índice ocupa mas espacio que el texto a indexar, pudiendo alcanzar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado por el índice es buscar una representación compacta del mismo. Pero en grandes colecciones de texto, el índice aun comprimido suele ser demasiado grande como para residir en memoria principal. En estos casos, la cantidad de accesos a discos realizados durante el procesamiento de una consulta resulta crítica para la performance del índice. Nuestro ámbito de investigación es el estudio de índices comprimidos y en memoria secundaria para búsquedas en texto.Eje: Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI)2015-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/45609spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:02:25Zoai:sedici.unlp.edu.ar:10915/45609Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:02:25.971SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Indexando bases de datos de texto |
title |
Indexando bases de datos de texto |
spellingShingle |
Indexando bases de datos de texto Herrera, Norma Edith Ciencias Informáticas base de datos indezación |
title_short |
Indexando bases de datos de texto |
title_full |
Indexando bases de datos de texto |
title_fullStr |
Indexando bases de datos de texto |
title_full_unstemmed |
Indexando bases de datos de texto |
title_sort |
Indexando bases de datos de texto |
dc.creator.none.fl_str_mv |
Herrera, Norma Edith Ruano, Carina Ruano, Darío Esquivel, Susana Cecilia |
author |
Herrera, Norma Edith |
author_facet |
Herrera, Norma Edith Ruano, Carina Ruano, Darío Esquivel, Susana Cecilia |
author_role |
author |
author2 |
Ruano, Carina Ruano, Darío Esquivel, Susana Cecilia |
author2_role |
author author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas base de datos indezación |
topic |
Ciencias Informáticas base de datos indezación |
dc.description.none.fl_txt_mv |
Uno de los principales problemas al que nos enfrentamos al indexar una base de datos de texto es que el índice ocupa mas espacio que el texto a indexar, pudiendo alcanzar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado por el índice es buscar una representación compacta del mismo. Pero en grandes colecciones de texto, el índice aun comprimido suele ser demasiado grande como para residir en memoria principal. En estos casos, la cantidad de accesos a discos realizados durante el procesamiento de una consulta resulta crítica para la performance del índice. Nuestro ámbito de investigación es el estudio de índices comprimidos y en memoria secundaria para búsquedas en texto. Eje: Base de Datos y Minería de Datos Red de Universidades con Carreras en Informática (RedUNCI) |
description |
Uno de los principales problemas al que nos enfrentamos al indexar una base de datos de texto es que el índice ocupa mas espacio que el texto a indexar, pudiendo alcanzar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado por el índice es buscar una representación compacta del mismo. Pero en grandes colecciones de texto, el índice aun comprimido suele ser demasiado grande como para residir en memoria principal. En estos casos, la cantidad de accesos a discos realizados durante el procesamiento de una consulta resulta crítica para la performance del índice. Nuestro ámbito de investigación es el estudio de índices comprimidos y en memoria secundaria para búsquedas en texto. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-04 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/45609 |
url |
http://sedici.unlp.edu.ar/handle/10915/45609 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Argentina (CC BY-NC-SA 2.5) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844615891520585728 |
score |
13.070432 |