Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
- Autores
- Echeverría Perpetua, Fabio Santiago
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- D'Argenio, Pedro Ruben
- Descripción
- Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.
Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/557118
Ver los metadatos del registro completo
| id |
RDUUNC_3abcde57ffaf46daf3587e309f6730b8 |
|---|---|
| oai_identifier_str |
oai:rdu.unc.edu.ar:11086/557118 |
| network_acronym_str |
RDUUNC |
| repository_id_str |
2572 |
| network_name_str |
Repositorio Digital Universitario (UNC) |
| spelling |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma ceroEcheverría Perpetua, Fabio SantiagoConvergencia y aprendizaje en los juegosJuegos estocásticosDecisiones probabilísticasConvergence and learning in gamesStochastic gamesProbabilistic decisionsQ-learningSmart samplingTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-SamplingFil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2025-08-08info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/557118spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-06-04T09:45:20Zoai:rdu.unc.edu.ar:11086/557118Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-06-04 09:45:21.294Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
| dc.title.none.fl_str_mv |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| title |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| spellingShingle |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero Echeverría Perpetua, Fabio Santiago Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling |
| title_short |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| title_full |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| title_fullStr |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| title_full_unstemmed |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| title_sort |
Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero |
| dc.creator.none.fl_str_mv |
Echeverría Perpetua, Fabio Santiago |
| author |
Echeverría Perpetua, Fabio Santiago |
| author_facet |
Echeverría Perpetua, Fabio Santiago |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
D'Argenio, Pedro Ruben |
| dc.subject.none.fl_str_mv |
Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling |
| topic |
Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling |
| dc.description.none.fl_txt_mv |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling. Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
| description |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08-08 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/557118 |
| url |
http://hdl.handle.net/11086/557118 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
| reponame_str |
Repositorio Digital Universitario (UNC) |
| collection |
Repositorio Digital Universitario (UNC) |
| instname_str |
Universidad Nacional de Córdoba |
| instacron_str |
UNC |
| institution |
UNC |
| repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
| repository.mail.fl_str_mv |
oca.unc@gmail.com |
| _version_ |
1867091380669513728 |
| score |
12.83248 |