Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos

Autores
Cifuentes, Santiago
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Martínez, María Vanina
Rodríguez, Ricardo Oscar
Descripción
Las bases de datos con forma de grafo representan de una forma efectiva relaciones binarias entre entidades, y permiten procesar y consultar por conexiones no triviales de forma eficiente. Como en el caso relacional, se espera que los datos preserven un conjunto de restricciones de integridad que capturen la estructura semántica del mundo que representan. Un posible enfoque para lidiar con bases de datos que no satisfacen su conjunto de reglas de integridad consiste en remplazarlas por una nueva base de datos ‘similar’ a la original, pero que satisfaga el conjunto de restricciones. Es decir, un repair de la base de datos original. En este trabajo estudiamos el problema de computar (subset y superset) repairs de bases de datos con forma de grafo con datos en los nodos usando una noci´on de consistencia basada en conjuntos de expresiones del lenguaje Reg-GXPath, interpretadas como restricciones de integridad. Demostramos que para los fragmentos positivos de Reg-GXPath estos problemas admiten algoritmos polinomiales mientras que el poder expresivo completo del lenguaje vuelve el problema intratable. Finalmente, también estudiamos el problema de computar preferred repairs sobre dos criterios de preferencia distintos, mostrando que en la mayor´ıa de los casos la complejidad computacional del problema no cambia.
Graph databases embrace in an effective way relationships among data and allows to process and query these connections efficiently. As in the relational case, it is expected that data preserves a set of integrity constraints that define the semantic structure of the world it represents. When a database does not satisfy its integrity constraints, a possible approach is to search for a ‘similar’ database that does satisfy the constraints, a.k.a a repair. In this work we study the problem of computing (subset and superset) repairs for graph databases with data values using a notion of consistency based on a set of Reg-GXPath expressions as integrity constraints. We show that for positive fragments of Reg-GXPath these problems admit a polynomial time algorithm while the full expressive power of the language renders them intractable. Finally, we also study the problem of computing preferred repairs based on two different preference criteria, showing that in most cases the computation complexity is not increased.
Fil: Cifuentes, Santiago. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
DATABASE REPAIR
PATH CONSTRAINTS
DATA CLEANING
REG-GXPATH
DATA-GRAPH
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000550_Cifuentes

id BDUBAFCEN_6bd294a3432f364f3371b8abb8247904
oai_identifier_str seminario:seminario_nCOM000550_Cifuentes
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminosOn the complexity of finding data-graphs repairs under path and node constraintsCifuentes, SantiagoDATABASE REPAIRPATH CONSTRAINTSDATA CLEANINGREG-GXPATHDATA-GRAPHLas bases de datos con forma de grafo representan de una forma efectiva relaciones binarias entre entidades, y permiten procesar y consultar por conexiones no triviales de forma eficiente. Como en el caso relacional, se espera que los datos preserven un conjunto de restricciones de integridad que capturen la estructura semántica del mundo que representan. Un posible enfoque para lidiar con bases de datos que no satisfacen su conjunto de reglas de integridad consiste en remplazarlas por una nueva base de datos ‘similar’ a la original, pero que satisfaga el conjunto de restricciones. Es decir, un repair de la base de datos original. En este trabajo estudiamos el problema de computar (subset y superset) repairs de bases de datos con forma de grafo con datos en los nodos usando una noci´on de consistencia basada en conjuntos de expresiones del lenguaje Reg-GXPath, interpretadas como restricciones de integridad. Demostramos que para los fragmentos positivos de Reg-GXPath estos problemas admiten algoritmos polinomiales mientras que el poder expresivo completo del lenguaje vuelve el problema intratable. Finalmente, también estudiamos el problema de computar preferred repairs sobre dos criterios de preferencia distintos, mostrando que en la mayor´ıa de los casos la complejidad computacional del problema no cambia.Graph databases embrace in an effective way relationships among data and allows to process and query these connections efficiently. As in the relational case, it is expected that data preserves a set of integrity constraints that define the semantic structure of the world it represents. When a database does not satisfy its integrity constraints, a possible approach is to search for a ‘similar’ database that does satisfy the constraints, a.k.a a repair. In this work we study the problem of computing (subset and superset) repairs for graph databases with data values using a notion of consistency based on a set of Reg-GXPath expressions as integrity constraints. We show that for positive fragments of Reg-GXPath these problems admit a polynomial time algorithm while the full expressive power of the language renders them intractable. Finally, we also study the problem of computing preferred repairs based on two different preference criteria, showing that in most cases the computation complexity is not increased.Fil: Cifuentes, Santiago. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMartínez, María VaninaRodríguez, Ricardo Oscar2021info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000550_Cifuentesspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-04-09T08:25:46Zseminario:seminario_nCOM000550_CifuentesInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-04-09 08:25:47.743Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
On the complexity of finding data-graphs repairs under path and node constraints
title Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
spellingShingle Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
Cifuentes, Santiago
DATABASE REPAIR
PATH CONSTRAINTS
DATA CLEANING
REG-GXPATH
DATA-GRAPH
title_short Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
title_full Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
title_fullStr Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
title_full_unstemmed Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
title_sort Sobre la complejidad del problema de encontrar data-graph repairs bajo restricciones de nodos y caminos
dc.creator.none.fl_str_mv Cifuentes, Santiago
author Cifuentes, Santiago
author_facet Cifuentes, Santiago
author_role author
dc.contributor.none.fl_str_mv Martínez, María Vanina
Rodríguez, Ricardo Oscar
dc.subject.none.fl_str_mv DATABASE REPAIR
PATH CONSTRAINTS
DATA CLEANING
REG-GXPATH
DATA-GRAPH
topic DATABASE REPAIR
PATH CONSTRAINTS
DATA CLEANING
REG-GXPATH
DATA-GRAPH
dc.description.none.fl_txt_mv Las bases de datos con forma de grafo representan de una forma efectiva relaciones binarias entre entidades, y permiten procesar y consultar por conexiones no triviales de forma eficiente. Como en el caso relacional, se espera que los datos preserven un conjunto de restricciones de integridad que capturen la estructura semántica del mundo que representan. Un posible enfoque para lidiar con bases de datos que no satisfacen su conjunto de reglas de integridad consiste en remplazarlas por una nueva base de datos ‘similar’ a la original, pero que satisfaga el conjunto de restricciones. Es decir, un repair de la base de datos original. En este trabajo estudiamos el problema de computar (subset y superset) repairs de bases de datos con forma de grafo con datos en los nodos usando una noci´on de consistencia basada en conjuntos de expresiones del lenguaje Reg-GXPath, interpretadas como restricciones de integridad. Demostramos que para los fragmentos positivos de Reg-GXPath estos problemas admiten algoritmos polinomiales mientras que el poder expresivo completo del lenguaje vuelve el problema intratable. Finalmente, también estudiamos el problema de computar preferred repairs sobre dos criterios de preferencia distintos, mostrando que en la mayor´ıa de los casos la complejidad computacional del problema no cambia.
Graph databases embrace in an effective way relationships among data and allows to process and query these connections efficiently. As in the relational case, it is expected that data preserves a set of integrity constraints that define the semantic structure of the world it represents. When a database does not satisfy its integrity constraints, a possible approach is to search for a ‘similar’ database that does satisfy the constraints, a.k.a a repair. In this work we study the problem of computing (subset and superset) repairs for graph databases with data values using a notion of consistency based on a set of Reg-GXPath expressions as integrity constraints. We show that for positive fragments of Reg-GXPath these problems admit a polynomial time algorithm while the full expressive power of the language renders them intractable. Finally, we also study the problem of computing preferred repairs based on two different preference criteria, showing that in most cases the computation complexity is not increased.
Fil: Cifuentes, Santiago. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Las bases de datos con forma de grafo representan de una forma efectiva relaciones binarias entre entidades, y permiten procesar y consultar por conexiones no triviales de forma eficiente. Como en el caso relacional, se espera que los datos preserven un conjunto de restricciones de integridad que capturen la estructura semántica del mundo que representan. Un posible enfoque para lidiar con bases de datos que no satisfacen su conjunto de reglas de integridad consiste en remplazarlas por una nueva base de datos ‘similar’ a la original, pero que satisfaga el conjunto de restricciones. Es decir, un repair de la base de datos original. En este trabajo estudiamos el problema de computar (subset y superset) repairs de bases de datos con forma de grafo con datos en los nodos usando una noci´on de consistencia basada en conjuntos de expresiones del lenguaje Reg-GXPath, interpretadas como restricciones de integridad. Demostramos que para los fragmentos positivos de Reg-GXPath estos problemas admiten algoritmos polinomiales mientras que el poder expresivo completo del lenguaje vuelve el problema intratable. Finalmente, también estudiamos el problema de computar preferred repairs sobre dos criterios de preferencia distintos, mostrando que en la mayor´ıa de los casos la complejidad computacional del problema no cambia.
publishDate 2021
dc.date.none.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000550_Cifuentes
url https://hdl.handle.net/20.500.12110/seminario_nCOM000550_Cifuentes
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1861996583181090816
score 13.018236