Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria

Autores: Feltes, Joaquín Ignacio
Año de publicación: 2024
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: D'Argenio, Pedro Ruben
Descripción: Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.
The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.
Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia: Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
Nivel de accesibilidad: acceso abierto
Condiciones de uso
Repositorio
Institución: Universidad Nacional de Córdoba
OAI Identificador: oai:rdu.unc.edu.ar:11086/552052

Acceder

id	RDUUNC_838ee79029b01f4fb00e59338deec1f0
oai_identifier_str	oai:rdu.unc.edu.ar:11086/552052
network_acronym_str	RDUUNC
repository_id_str	2572
network_name_str	Repositorio Digital Universitario (UNC)
spelling	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritariaFeltes, Joaquín IgnacioTeoría de la computaciónLógicaVerificación de modelosJuego estocásticoMultiobjetivoAlcanzabilidadRecompensas totalesTheory of computationLogicVerification by model checkingReachabilityTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.D'Argenio, Pedro Ruben2024-05-10info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/552052spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-02-12T12:15:55Zoai:rdu.unc.edu.ar:11086/552052Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-02-12 12:15:56.512Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
spellingShingle	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria Feltes, Joaquín Ignacio Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability
title_short	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_fullStr	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full_unstemmed	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_sort	Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
dc.creator.none.fl_str_mv	Feltes, Joaquín Ignacio
author	Feltes, Joaquín Ignacio
author_facet	Feltes, Joaquín Ignacio
author_role	author
dc.contributor.none.fl_str_mv	D'Argenio, Pedro Ruben
dc.subject.none.fl_str_mv	Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability
topic	Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability
dc.description.none.fl_txt_mv	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos. The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
publishDate	2024
dc.date.none.fl_str_mv	2024-05-10
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11086/552052
url	http://hdl.handle.net/11086/552052
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC
reponame_str	Repositorio Digital Universitario (UNC)
collection	Repositorio Digital Universitario (UNC)
instname_str	Universidad Nacional de Córdoba
instacron_str	UNC
institution	UNC
repository.name.fl_str_mv	Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv	oca.unc@gmail.com
_version_	1856934940331999232
score	12.930639

Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria

Publicaciones similares