Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero

Autores
Echeverría Perpetua, Fabio Santiago
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
D'Argenio, Pedro Ruben
Descripción
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.
Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/557118

id RDUUNC_3abcde57ffaf46daf3587e309f6730b8
oai_identifier_str oai:rdu.unc.edu.ar:11086/557118
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma ceroEcheverría Perpetua, Fabio SantiagoConvergencia y aprendizaje en los juegosJuegos estocásticosDecisiones probabilísticasConvergence and learning in gamesStochastic gamesProbabilistic decisionsQ-learningSmart samplingTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-SamplingFil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2025-08-08info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/557118spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-06-04T09:45:20Zoai:rdu.unc.edu.ar:11086/557118Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-06-04 09:45:21.294Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
spellingShingle Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
Echeverría Perpetua, Fabio Santiago
Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling
title_short Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_full Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_fullStr Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_full_unstemmed Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_sort Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
dc.creator.none.fl_str_mv Echeverría Perpetua, Fabio Santiago
author Echeverría Perpetua, Fabio Santiago
author_facet Echeverría Perpetua, Fabio Santiago
author_role author
dc.contributor.none.fl_str_mv D'Argenio, Pedro Ruben
dc.subject.none.fl_str_mv Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling
topic Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling
dc.description.none.fl_txt_mv Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.
Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate 2025
dc.date.none.fl_str_mv 2025-08-08
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/557118
url http://hdl.handle.net/11086/557118
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1867091380669513728
score 12.83248