Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo

Autores: Negrelli, Valentín
Año de publicación: 2025
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Fraire, Juan Andrés
Cherini, Renato
Descripción: Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro.
This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed.
Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia: Machine learning
Aprendizaje por refuerzos Monte Carlo
Aprendizaje profundo
Redes convolucionales sobre grafos
Redes tolerantes a demoras inciertas
Procesos de Markov parcialmente observables
Nivel de accesibilidad: acceso abierto
Condiciones de uso
Repositorio
Institución: Universidad Nacional de Córdoba
OAI Identificador: oai:rdu.unc.edu.ar:11086/560325

Acceder

id	RDUUNC_7c8e9ddf8f7cea4039c4ad44273f6416
oai_identifier_str	oai:rdu.unc.edu.ar:11086/560325
network_acronym_str	RDUUNC
repository_id_str	2572
network_name_str	Repositorio Digital Universitario (UNC)
spelling	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundoNegrelli, ValentínMachine learningAprendizaje por refuerzos Monte CarloAprendizaje profundoRedes convolucionales sobre grafosRedes tolerantes a demoras inciertasProcesos de Markov parcialmente observablesTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro.This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed.Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Fraire, Juan AndrésCherini, Renato2025-12info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/560325spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-06-04T09:42:29Zoai:rdu.unc.edu.ar:11086/560325Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-06-04 09:42:30.085Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
spellingShingle	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo Negrelli, Valentín Machine learning Aprendizaje por refuerzos Monte Carlo Aprendizaje profundo Redes convolucionales sobre grafos Redes tolerantes a demoras inciertas Procesos de Markov parcialmente observables
title_short	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_full	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_fullStr	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_full_unstemmed	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
title_sort	Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo
dc.creator.none.fl_str_mv	Negrelli, Valentín
author	Negrelli, Valentín
author_facet	Negrelli, Valentín
author_role	author
dc.contributor.none.fl_str_mv	Fraire, Juan Andrés Cherini, Renato
dc.subject.none.fl_str_mv	Machine learning Aprendizaje por refuerzos Monte Carlo Aprendizaje profundo Redes convolucionales sobre grafos Redes tolerantes a demoras inciertas Procesos de Markov parcialmente observables
topic	Machine learning Aprendizaje por refuerzos Monte Carlo Aprendizaje profundo Redes convolucionales sobre grafos Redes tolerantes a demoras inciertas Procesos de Markov parcialmente observables
dc.description.none.fl_txt_mv	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina. Este trabajo evalúa el desempeño de GROGU, un algoritmo de aprendizaje por refuerzos profundo basado en redes neuronales sobre grafos, para optimizar la probabilidad de entrega exitosa (SDP), la adaptabilidad y los costos en el enrutamiento de Redes Tolerantes a Demoras (DTNs) inciertas. El enfoque modela el problema como un Proceso de Decisión de Markov Parcialmente Observable y emplea métodos de Monte Carlo para el entrenamiento. Se contextualiza la necesidad de soluciones eficientes frente a los desafíos de la comunicación satelital en entornos hostiles y de alto costo. Se comparan enfoques estadísticos, analíticos y basados en aprendizaje previamente propuestos en la literatura. Se describen formalmente el entorno, el agente y el aprendiz que componen GROGU, junto con los resultados experimentales. Se realiza un análisis de hiperparámetros considerando métricas de SDP y costos de entrenamiento. Además, se compara su evolución respecto de versiones anteriores y frente a algoritmos alternativos, evaluando desempeño, costos y capacidad de adaptación. Finalmente, se presentan conclusiones y líneas de trabajo futuro. This work evaluates the performance of GROGU, a deep reinforcement learning algorithm based on graph neural networks, aimed at optimizing the Successful Delivery Probability (SDP), adaptability, and costs in routing for uncertain Delay-Tolerant Networks (DTNs). The problem is modeled as a Partially Observable Markov Decision Process and trained using Monte Carlo methods. The study is motivated by the need for efficient solutions to address the challenges of satellite communications in hostile and high-cost environments. Statistical, analytical, and learning-based routing approaches previously proposed in the literature are reviewed and compared. The environment, agent, and learner that compose GROGU are formally defined, and experimental results are presented. A hyperparameter analysis is conducted considering SDP and training cost metrics. The evolution of GROGU is analyzed by comparing it with previous iterations and alternative algorithms in terms of performance, cost, and adaptability. Finally, conclusions and directions for future work are discussed. Fil: Negrelli, Valentín. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate	2025
dc.date.none.fl_str_mv	2025-12
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11086/560325
url	http://hdl.handle.net/11086/560325
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC
reponame_str	Repositorio Digital Universitario (UNC)
collection	Repositorio Digital Universitario (UNC)
instname_str	Universidad Nacional de Córdoba
instacron_str	UNC
institution	UNC
repository.name.fl_str_mv	Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv	oca.unc@gmail.com
_version_	1867091275881119744
score	12.957546

Optimización del enrutamiento en redes tolerantes a demoras inciertas con aprendizaje por refuerzos profundo

Publicaciones similares