Test de hipótesis sobre homología persistente utilizando la distancia de Fermat

Autores
Battocchio, Diego Javier
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Groisman, Pablo José
Descripción
Esta tesis se centra en el análisis de datos topológicos (TDA) y, específicamente, en el desarrollo de tests de hipótesis para detectar características topológicas de una variedad a partir de muestras i.i.d. de puntos. Se introducen conceptos clave de TDA y se describen técnicas actuales para realizar tests sobre diagramas de persistencia, los cuales resumen la homología de un conjunto de datos, facilitando la identificación de ciclos de primer grado (curvas no deformables a un punto). Tradicionalmente, estas pruebas se basan en la norma euclídea, pero aquí se explora el uso de la distancia de Fermat, que ha demostrado ser beneficiosa en conjuntos con topología subyacente. Mediante simulaciones de regiones de confianza sobre datos sintéticos y reales, se comparan ambas distancias, demostrando que la distancia de Fermat supera a la euclídea en la detección de características topológicas, con resultados estadísticamente significativos. Además, se muestra que la distancia de Fermat es computacionalmente escalable frente a la dimensionalidad de los datos. Como aporte adicional, se desarrolló una biblioteca en R para facilitar investigaciones futuras sobre el uso de la distancia de Fermat en este contexto.
This dissertation focuses on topological data analysis (TDA) and, specifically, on the development of hypothesis tests to detect topological features of a manifold based on i.i.d. samples. Key TDA concepts are introduced, and state-of-the-art techniques for hypothesis testing on persistence diagrams are described. These diagrams summarize the homology of a dataset, helping to identify first-degree cycles (curves that cannot be deformed to a point). Traditionally, such tests rely on the Euclidean norm, but this work explores the use of the Fermat distance, which has shown benefits in datasets with underlying topology. Through simulations of confidence sets on synthetic and real datasets, both distances are compared, demonstrating that Fermat distance outperforms Euclidean distance in detecting topological features, with statistically significant results. Moreover, Fermat distance is shown to be computationally scalable with respect to data dimensionality. As an additional contribution, an R library was developed to facilitate future research on Fermat distance in this context.
Fil: Battocchio, Diego Javier. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
TDA
TOPOLOGIA
HOMOLOGIA PERSISTENTE
DISTANCIA DE FERMAT
PRUEBA DE HIPOTESIS
DIAGRAMAS DE PERSISTENCIA
REGIONES DE CONFIANZA
TDA
TOPOLOGY
PERSISTENT HOMOLOGY
FERMAT DISTANCE
HYPOTHESIS TESTING
PERSISTENCE DIAGRAMAS
CONFIDENCE SETS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7799_Battocchio

id BDUBAFCEN_74fc3e0622ba5bcd8e1c3f067c73503e
oai_identifier_str tesis:tesis_n7799_Battocchio
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Test de hipótesis sobre homología persistente utilizando la distancia de FermatHypothesis testing for persistent homology using the Fermat distanceBattocchio, Diego JavierTDATOPOLOGIAHOMOLOGIA PERSISTENTEDISTANCIA DE FERMATPRUEBA DE HIPOTESISDIAGRAMAS DE PERSISTENCIAREGIONES DE CONFIANZATDATOPOLOGYPERSISTENT HOMOLOGYFERMAT DISTANCEHYPOTHESIS TESTINGPERSISTENCE DIAGRAMASCONFIDENCE SETSEsta tesis se centra en el análisis de datos topológicos (TDA) y, específicamente, en el desarrollo de tests de hipótesis para detectar características topológicas de una variedad a partir de muestras i.i.d. de puntos. Se introducen conceptos clave de TDA y se describen técnicas actuales para realizar tests sobre diagramas de persistencia, los cuales resumen la homología de un conjunto de datos, facilitando la identificación de ciclos de primer grado (curvas no deformables a un punto). Tradicionalmente, estas pruebas se basan en la norma euclídea, pero aquí se explora el uso de la distancia de Fermat, que ha demostrado ser beneficiosa en conjuntos con topología subyacente. Mediante simulaciones de regiones de confianza sobre datos sintéticos y reales, se comparan ambas distancias, demostrando que la distancia de Fermat supera a la euclídea en la detección de características topológicas, con resultados estadísticamente significativos. Además, se muestra que la distancia de Fermat es computacionalmente escalable frente a la dimensionalidad de los datos. Como aporte adicional, se desarrolló una biblioteca en R para facilitar investigaciones futuras sobre el uso de la distancia de Fermat en este contexto.This dissertation focuses on topological data analysis (TDA) and, specifically, on the development of hypothesis tests to detect topological features of a manifold based on i.i.d. samples. Key TDA concepts are introduced, and state-of-the-art techniques for hypothesis testing on persistence diagrams are described. These diagrams summarize the homology of a dataset, helping to identify first-degree cycles (curves that cannot be deformed to a point). Traditionally, such tests rely on the Euclidean norm, but this work explores the use of the Fermat distance, which has shown benefits in datasets with underlying topology. Through simulations of confidence sets on synthetic and real datasets, both distances are compared, demonstrating that Fermat distance outperforms Euclidean distance in detecting topological features, with statistically significant results. Moreover, Fermat distance is shown to be computationally scalable with respect to data dimensionality. As an additional contribution, an R library was developed to facilitate future research on Fermat distance in this context.Fil: Battocchio, Diego Javier. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesGroisman, Pablo José2025-08-29info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7799_Battocchiospainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-06-04T09:43:08Ztesis:tesis_n7799_BattocchioInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-06-04 09:43:09.574Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
Hypothesis testing for persistent homology using the Fermat distance
title Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
spellingShingle Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
Battocchio, Diego Javier
TDA
TOPOLOGIA
HOMOLOGIA PERSISTENTE
DISTANCIA DE FERMAT
PRUEBA DE HIPOTESIS
DIAGRAMAS DE PERSISTENCIA
REGIONES DE CONFIANZA
TDA
TOPOLOGY
PERSISTENT HOMOLOGY
FERMAT DISTANCE
HYPOTHESIS TESTING
PERSISTENCE DIAGRAMAS
CONFIDENCE SETS
title_short Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
title_full Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
title_fullStr Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
title_full_unstemmed Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
title_sort Test de hipótesis sobre homología persistente utilizando la distancia de Fermat
dc.creator.none.fl_str_mv Battocchio, Diego Javier
author Battocchio, Diego Javier
author_facet Battocchio, Diego Javier
author_role author
dc.contributor.none.fl_str_mv Groisman, Pablo José
dc.subject.none.fl_str_mv TDA
TOPOLOGIA
HOMOLOGIA PERSISTENTE
DISTANCIA DE FERMAT
PRUEBA DE HIPOTESIS
DIAGRAMAS DE PERSISTENCIA
REGIONES DE CONFIANZA
TDA
TOPOLOGY
PERSISTENT HOMOLOGY
FERMAT DISTANCE
HYPOTHESIS TESTING
PERSISTENCE DIAGRAMAS
CONFIDENCE SETS
topic TDA
TOPOLOGIA
HOMOLOGIA PERSISTENTE
DISTANCIA DE FERMAT
PRUEBA DE HIPOTESIS
DIAGRAMAS DE PERSISTENCIA
REGIONES DE CONFIANZA
TDA
TOPOLOGY
PERSISTENT HOMOLOGY
FERMAT DISTANCE
HYPOTHESIS TESTING
PERSISTENCE DIAGRAMAS
CONFIDENCE SETS
dc.description.none.fl_txt_mv Esta tesis se centra en el análisis de datos topológicos (TDA) y, específicamente, en el desarrollo de tests de hipótesis para detectar características topológicas de una variedad a partir de muestras i.i.d. de puntos. Se introducen conceptos clave de TDA y se describen técnicas actuales para realizar tests sobre diagramas de persistencia, los cuales resumen la homología de un conjunto de datos, facilitando la identificación de ciclos de primer grado (curvas no deformables a un punto). Tradicionalmente, estas pruebas se basan en la norma euclídea, pero aquí se explora el uso de la distancia de Fermat, que ha demostrado ser beneficiosa en conjuntos con topología subyacente. Mediante simulaciones de regiones de confianza sobre datos sintéticos y reales, se comparan ambas distancias, demostrando que la distancia de Fermat supera a la euclídea en la detección de características topológicas, con resultados estadísticamente significativos. Además, se muestra que la distancia de Fermat es computacionalmente escalable frente a la dimensionalidad de los datos. Como aporte adicional, se desarrolló una biblioteca en R para facilitar investigaciones futuras sobre el uso de la distancia de Fermat en este contexto.
This dissertation focuses on topological data analysis (TDA) and, specifically, on the development of hypothesis tests to detect topological features of a manifold based on i.i.d. samples. Key TDA concepts are introduced, and state-of-the-art techniques for hypothesis testing on persistence diagrams are described. These diagrams summarize the homology of a dataset, helping to identify first-degree cycles (curves that cannot be deformed to a point). Traditionally, such tests rely on the Euclidean norm, but this work explores the use of the Fermat distance, which has shown benefits in datasets with underlying topology. Through simulations of confidence sets on synthetic and real datasets, both distances are compared, demonstrating that Fermat distance outperforms Euclidean distance in detecting topological features, with statistically significant results. Moreover, Fermat distance is shown to be computationally scalable with respect to data dimensionality. As an additional contribution, an R library was developed to facilitate future research on Fermat distance in this context.
Fil: Battocchio, Diego Javier. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Esta tesis se centra en el análisis de datos topológicos (TDA) y, específicamente, en el desarrollo de tests de hipótesis para detectar características topológicas de una variedad a partir de muestras i.i.d. de puntos. Se introducen conceptos clave de TDA y se describen técnicas actuales para realizar tests sobre diagramas de persistencia, los cuales resumen la homología de un conjunto de datos, facilitando la identificación de ciclos de primer grado (curvas no deformables a un punto). Tradicionalmente, estas pruebas se basan en la norma euclídea, pero aquí se explora el uso de la distancia de Fermat, que ha demostrado ser beneficiosa en conjuntos con topología subyacente. Mediante simulaciones de regiones de confianza sobre datos sintéticos y reales, se comparan ambas distancias, demostrando que la distancia de Fermat supera a la euclídea en la detección de características topológicas, con resultados estadísticamente significativos. Además, se muestra que la distancia de Fermat es computacionalmente escalable frente a la dimensionalidad de los datos. Como aporte adicional, se desarrolló una biblioteca en R para facilitar investigaciones futuras sobre el uso de la distancia de Fermat en este contexto.
publishDate 2025
dc.date.none.fl_str_mv 2025-08-29
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7799_Battocchio
url https://hdl.handle.net/20.500.12110/tesis_n7799_Battocchio
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1867090985811443712
score 13.343307