Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo

Autores
Negrelli, Valentín
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Fraire, Juan Andrés
Cherini, Renato
Descripción
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro.
This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Machine learning
Aprendizaje por refuerzos Monte Carlo
Aprendizaje profundo
Redes convolucionales sobre grafos
Redes tolerantes a demoras inciertas
Procesos de Markov parcialmente observables
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/560325

id RDUUNC_7c8e9ddf8f7cea4039c4ad44273f6416
oai_identifier_str oai:rdu.unc.edu.ar:11086/560325
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundoNegrelli, ValentínMachine learningAprendizaje por refuerzos Monte CarloAprendizaje profundoRedes convolucionales sobre grafosRedes tolerantes a demoras inciertasProcesos de Markov parcialmente observablesTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro.This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed.Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Fraire, Juan AndrésCherini, Renato2025-12info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/560325spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-03-26T11:20:48Zoai:rdu.unc.edu.ar:11086/560325Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-03-26 11:20:48.765Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
spellingShingle Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
Negrelli, Valentín
Machine learning
Aprendizaje por refuerzos Monte Carlo
Aprendizaje profundo
Redes convolucionales sobre grafos
Redes tolerantes a demoras inciertas
Procesos de Markov parcialmente observables
title_short Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_full Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_fullStr Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_full_unstemmed Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_sort Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
dc.creator.none.fl_str_mv Negrelli, Valentín
author Negrelli, Valentín
author_facet Negrelli, Valentín
author_role author
dc.contributor.none.fl_str_mv Fraire, Juan Andrés
Cherini, Renato
dc.subject.none.fl_str_mv Machine learning
Aprendizaje por refuerzos Monte Carlo
Aprendizaje profundo
Redes convolucionales sobre grafos
Redes tolerantes a demoras inciertas
Procesos de Markov parcialmente observables
topic Machine learning
Aprendizaje por refuerzos Monte Carlo
Aprendizaje profundo
Redes convolucionales sobre grafos
Redes tolerantes a demoras inciertas
Procesos de Markov parcialmente observables
dc.description.none.fl_txt_mv Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro.
This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate 2025
dc.date.none.fl_str_mv 2025-12
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/560325
url http://hdl.handle.net/11086/560325
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1860737319266418688
score 13.332987