Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
- Autores
- Feltes, Joaquín Ignacio
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- D'Argenio, Pedro Ruben
- Descripción
- Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.
The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/552052
Ver los metadatos del registro completo
id |
RDUUNC_838ee79029b01f4fb00e59338deec1f0 |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/552052 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritariaFeltes, Joaquín IgnacioTeoría de la computaciónLógicaVerificación de modelosJuego estocásticoMultiobjetivoAlcanzabilidadRecompensas totalesTheory of computationLogicVerification by model checkingReachabilityTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2024-05-10info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/552052spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-04T12:32:34Zoai:rdu.unc.edu.ar:11086/552052Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-04 12:32:35.045Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
title |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
spellingShingle |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria Feltes, Joaquín Ignacio Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability |
title_short |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
title_full |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
title_fullStr |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
title_full_unstemmed |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
title_sort |
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria |
dc.creator.none.fl_str_mv |
Feltes, Joaquín Ignacio |
author |
Feltes, Joaquín Ignacio |
author_facet |
Feltes, Joaquín Ignacio |
author_role |
author |
dc.contributor.none.fl_str_mv |
D'Argenio, Pedro Ruben |
dc.subject.none.fl_str_mv |
Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability |
topic |
Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability |
dc.description.none.fl_txt_mv |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos. The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
description |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-05-10 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/552052 |
url |
http://hdl.handle.net/11086/552052 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1842349644309331968 |
score |
13.13397 |