Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria

Autores
Feltes, Joaquín Ignacio
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
D'Argenio, Pedro Ruben
Descripción
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.
The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/552052

id RDUUNC_838ee79029b01f4fb00e59338deec1f0
oai_identifier_str oai:rdu.unc.edu.ar:11086/552052
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritariaFeltes, Joaquín IgnacioTeoría de la computaciónLógicaVerificación de modelosJuego estocásticoMultiobjetivoAlcanzabilidadRecompensas totalesTheory of computationLogicVerification by model checkingReachabilityTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2024-05-10info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/552052spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-04T12:32:34Zoai:rdu.unc.edu.ar:11086/552052Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-04 12:32:35.045Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
spellingShingle Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
Feltes, Joaquín Ignacio
Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
title_short Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_fullStr Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full_unstemmed Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_sort Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
dc.creator.none.fl_str_mv Feltes, Joaquín Ignacio
author Feltes, Joaquín Ignacio
author_facet Feltes, Joaquín Ignacio
author_role author
dc.contributor.none.fl_str_mv D'Argenio, Pedro Ruben
dc.subject.none.fl_str_mv Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
topic Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
dc.description.none.fl_txt_mv Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.
The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
publishDate 2024
dc.date.none.fl_str_mv 2024-05-10
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/552052
url http://hdl.handle.net/11086/552052
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1842349644309331968
score 13.13397