Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero

Autores: Echeverría Perpetua, Fabio Santiago
Año de publicación: 2025
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: D'Argenio, Pedro Ruben
Descripción: Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.
Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling
Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia: Convergencia y aprendizaje en los juegos
Juegos estocásticos
Decisiones probabilísticas
Convergence and learning in games
Stochastic games
Probabilistic decisions
Q-learning
Smart sampling
Nivel de accesibilidad: acceso abierto
Condiciones de uso
Repositorio
Institución: Universidad Nacional de Córdoba
OAI Identificador: oai:rdu.unc.edu.ar:11086/557118

Acceder

id	RDUUNC_3abcde57ffaf46daf3587e309f6730b8
oai_identifier_str	oai:rdu.unc.edu.ar:11086/557118
network_acronym_str	RDUUNC
repository_id_str	2572
network_name_str	Repositorio Digital Universitario (UNC)
spelling	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma ceroEcheverría Perpetua, Fabio SantiagoConvergencia y aprendizaje en los juegosJuegos estocásticosDecisiones probabilísticasConvergence and learning in gamesStochastic gamesProbabilistic decisionsQ-learningSmart samplingTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling.Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-SamplingFil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2025-08-08info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/557118spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-06-04T09:45:20Zoai:rdu.unc.edu.ar:11086/557118Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-06-04 09:45:21.294Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
spellingShingle	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero Echeverría Perpetua, Fabio Santiago Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling
title_short	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_full	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_fullStr	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_full_unstemmed	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
title_sort	Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero
dc.creator.none.fl_str_mv	Echeverría Perpetua, Fabio Santiago
author	Echeverría Perpetua, Fabio Santiago
author_facet	Echeverría Perpetua, Fabio Santiago
author_role	author
dc.contributor.none.fl_str_mv	D'Argenio, Pedro Ruben
dc.subject.none.fl_str_mv	Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling
topic	Convergencia y aprendizaje en los juegos Juegos estocásticos Decisiones probabilísticas Convergence and learning in games Stochastic games Probabilistic decisions Q-learning Smart sampling
dc.description.none.fl_txt_mv	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. Los juegos estocásticos de dos jugadores han emergido como una herramienta fundamental para modelar sistemas que interactúan con entornos no cooperativos. Estos juegos permiten formular problemas de síntesis y verificación como la construcción automática de estrategias que garanticen ciertos objetivos bajo incertidumbre. En esta tesis nos enfocamos en juegos estocásticos de suma cero, con información perfecta y turnos alternados, en los que los jugadores buscan maximizar o minimizar una función objetivo sobre un grafo con decisiones probabilísticas utilizando dos agentes: Q-learning y Smart Sampling. Two-player stochastic games have emerged as a fundamental tool for modeling systems that interact with non-cooperative environments. These games allow the formulation of synthesis and verification problems, such as the automatic construction of strategies that guarantee certain objectives under uncertainty. In this thesis, we focus on zero-sum stochastic games with perfect information and alternating turns, in which players seek to maximize or minimize an objective function on a graph with probabilistic decisions using two agents: Q-learning and Smart-Sampling Fil: Echeverría Perpetua, Fabio Santiago. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate	2025
dc.date.none.fl_str_mv	2025-08-08
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11086/557118
url	http://hdl.handle.net/11086/557118
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC
reponame_str	Repositorio Digital Universitario (UNC)
collection	Repositorio Digital Universitario (UNC)
instname_str	Universidad Nacional de Córdoba
instacron_str	UNC
institution	UNC
repository.name.fl_str_mv	Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv	oca.unc@gmail.com
_version_	1867091380669513728
score	12.83248

Técnicas basadas en simulación y aprendizaje para solucionar juegos estocásticos de suma cero

Publicaciones similares