Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos

Autores
de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El control de sistemas complejos puede ser realizado descomponiendo la tarea de control en una secuencia de modos de control, o simplemente modos. Cada modo implementa una ley de retroalimentación hasta que se activa una condición de terminación, en respuesta a la ocurrencia de un evento exógeno/endógeno que indica que la ejecución del modo debe finalizar. En este trabajo se presenta una propuesta novedosa para encontrar una política de conmutación óptima para resolver el problema de control optimizando alguna medida de costo/beneficio. Una política óptima implementa un programa de control multimodal  óptimo, el cual consiste en un encadenamiento de modos de control. La propuesta realizada incluye el desarrollo y formulación de un algoritmo basado en la idea de la programación dinámica integrando procesos Gaussianos y aprendizaje Bayesiano activo. Mediante el enfoque propuesto es posible realizar un uso eficiente de los datos para mejorar la exploración de las soluciones sobre espacios de estados continuos. Un caso de estudio representativo es abordado para demostrar el desempeño del algoritmo propuesto.
The control of complex systems can be done decomposing the control task into a sequence of control modes, or modes for short. Each mode implements a parameterized feedback law until a termination condition is activated in response to the occurrence of an exogenous/endogenous event, which indicates that the execution mode must end. This paper presents a novel approach to find an optimal switching policy to solve a control problem by optimizing some measure of cost/benefit. An optimal policy implements an optimal multimodal control program, consisting in a sequence of control modes. The proposal includes the development of an algorithm based on the idea of dynamic programming integrating Gaussian processes and Bayesian active learning. In addition, an efficient use of the data to improve the exploration of the continuous state spaces solutions can be achieved through this approach. A representative case study is discussed and analyzed to demonstrate the performance of the proposed algorithm.
Fil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina
Fil: Avila, Luis Omar. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Santa Fe. Instituto de Desarrollo y Diseño (i); Argentina
Fil: Sánchez Reinoso, Carlos Roberto. Universidad Nacional de Catamarca. Facultad de Tecnologia y Ciencias Aplicadas; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Acosta, Gerardo Gabriel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina
Materia
CONTROL MULTIMODAL
PROGRAMACIÓN DINÁMICA
PROCESOS GAUSSIANOS
INCERTIDUMBRE
POLÍTICA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-nd/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/6896

id CONICETDig_09929a6ba729f97cf90d82a8e9b6699c
oai_identifier_str oai:ri.conicet.gov.ar:11336/6896
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianosde Paula, MarianoAvila, Luis OmarSánchez Reinoso, Carlos RobertoAcosta, Gerardo GabrielCONTROL MULTIMODALPROGRAMACIÓN DINÁMICAPROCESOS GAUSSIANOSINCERTIDUMBREPOLÍTICAhttps://purl.org/becyt/ford/2.2https://purl.org/becyt/ford/2El control de sistemas complejos puede ser realizado descomponiendo la tarea de control en una secuencia de modos de control, o simplemente modos. Cada modo implementa una ley de retroalimentación hasta que se activa una condición de terminación, en respuesta a la ocurrencia de un evento exógeno/endógeno que indica que la ejecución del modo debe finalizar. En este trabajo se presenta una propuesta novedosa para encontrar una política de conmutación óptima para resolver el problema de control optimizando alguna medida de costo/beneficio. Una política óptima implementa un programa de control multimodal  óptimo, el cual consiste en un encadenamiento de modos de control. La propuesta realizada incluye el desarrollo y formulación de un algoritmo basado en la idea de la programación dinámica integrando procesos Gaussianos y aprendizaje Bayesiano activo. Mediante el enfoque propuesto es posible realizar un uso eficiente de los datos para mejorar la exploración de las soluciones sobre espacios de estados continuos. Un caso de estudio representativo es abordado para demostrar el desempeño del algoritmo propuesto.The control of complex systems can be done decomposing the control task into a sequence of control modes, or modes for short. Each mode implements a parameterized feedback law until a termination condition is activated in response to the occurrence of an exogenous/endogenous event, which indicates that the execution mode must end. This paper presents a novel approach to find an optimal switching policy to solve a control problem by optimizing some measure of cost/benefit. An optimal policy implements an optimal multimodal control program, consisting in a sequence of control modes. The proposal includes the development of an algorithm based on the idea of dynamic programming integrating Gaussian processes and Bayesian active learning. In addition, an efficient use of the data to improve the exploration of the continuous state spaces solutions can be achieved through this approach. A representative case study is discussed and analyzed to demonstrate the performance of the proposed algorithm.Fil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; ArgentinaFil: Avila, Luis Omar. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Santa Fe. Instituto de Desarrollo y Diseño (i); ArgentinaFil: Sánchez Reinoso, Carlos Roberto. Universidad Nacional de Catamarca. Facultad de Tecnologia y Ciencias Aplicadas; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Acosta, Gerardo Gabriel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; ArgentinaElsevier2015-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/6896de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel; Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos; Elsevier; Revista Iberoamericana de Automatica E Informatica Industrial; 12; 4; 10-2015; 385-3961697-7912spainfo:eu-repo/semantics/altIdentifier/url/http://www.sciencedirect.com/science/article/pii/S1697791215000552info:eu-repo/semantics/altIdentifier/url/http://goo.gl/yZeVQNinfo:eu-repo/semantics/altIdentifier/doi/10.1016/j.riai.2015.09.004info:eu-repo/semantics/altIdentifier/doi/info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-10T13:12:36Zoai:ri.conicet.gov.ar:11336/6896instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-10 13:12:37.231CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
title Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
spellingShingle Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
de Paula, Mariano
CONTROL MULTIMODAL
PROGRAMACIÓN DINÁMICA
PROCESOS GAUSSIANOS
INCERTIDUMBRE
POLÍTICA
title_short Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
title_full Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
title_fullStr Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
title_full_unstemmed Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
title_sort Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos
dc.creator.none.fl_str_mv de Paula, Mariano
Avila, Luis Omar
Sánchez Reinoso, Carlos Roberto
Acosta, Gerardo Gabriel
author de Paula, Mariano
author_facet de Paula, Mariano
Avila, Luis Omar
Sánchez Reinoso, Carlos Roberto
Acosta, Gerardo Gabriel
author_role author
author2 Avila, Luis Omar
Sánchez Reinoso, Carlos Roberto
Acosta, Gerardo Gabriel
author2_role author
author
author
dc.subject.none.fl_str_mv CONTROL MULTIMODAL
PROGRAMACIÓN DINÁMICA
PROCESOS GAUSSIANOS
INCERTIDUMBRE
POLÍTICA
topic CONTROL MULTIMODAL
PROGRAMACIÓN DINÁMICA
PROCESOS GAUSSIANOS
INCERTIDUMBRE
POLÍTICA
purl_subject.fl_str_mv https://purl.org/becyt/ford/2.2
https://purl.org/becyt/ford/2
dc.description.none.fl_txt_mv El control de sistemas complejos puede ser realizado descomponiendo la tarea de control en una secuencia de modos de control, o simplemente modos. Cada modo implementa una ley de retroalimentación hasta que se activa una condición de terminación, en respuesta a la ocurrencia de un evento exógeno/endógeno que indica que la ejecución del modo debe finalizar. En este trabajo se presenta una propuesta novedosa para encontrar una política de conmutación óptima para resolver el problema de control optimizando alguna medida de costo/beneficio. Una política óptima implementa un programa de control multimodal  óptimo, el cual consiste en un encadenamiento de modos de control. La propuesta realizada incluye el desarrollo y formulación de un algoritmo basado en la idea de la programación dinámica integrando procesos Gaussianos y aprendizaje Bayesiano activo. Mediante el enfoque propuesto es posible realizar un uso eficiente de los datos para mejorar la exploración de las soluciones sobre espacios de estados continuos. Un caso de estudio representativo es abordado para demostrar el desempeño del algoritmo propuesto.
The control of complex systems can be done decomposing the control task into a sequence of control modes, or modes for short. Each mode implements a parameterized feedback law until a termination condition is activated in response to the occurrence of an exogenous/endogenous event, which indicates that the execution mode must end. This paper presents a novel approach to find an optimal switching policy to solve a control problem by optimizing some measure of cost/benefit. An optimal policy implements an optimal multimodal control program, consisting in a sequence of control modes. The proposal includes the development of an algorithm based on the idea of dynamic programming integrating Gaussian processes and Bayesian active learning. In addition, an efficient use of the data to improve the exploration of the continuous state spaces solutions can be achieved through this approach. A representative case study is discussed and analyzed to demonstrate the performance of the proposed algorithm.
Fil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina
Fil: Avila, Luis Omar. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Santa Fe. Instituto de Desarrollo y Diseño (i); Argentina
Fil: Sánchez Reinoso, Carlos Roberto. Universidad Nacional de Catamarca. Facultad de Tecnologia y Ciencias Aplicadas; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Acosta, Gerardo Gabriel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina
description El control de sistemas complejos puede ser realizado descomponiendo la tarea de control en una secuencia de modos de control, o simplemente modos. Cada modo implementa una ley de retroalimentación hasta que se activa una condición de terminación, en respuesta a la ocurrencia de un evento exógeno/endógeno que indica que la ejecución del modo debe finalizar. En este trabajo se presenta una propuesta novedosa para encontrar una política de conmutación óptima para resolver el problema de control optimizando alguna medida de costo/beneficio. Una política óptima implementa un programa de control multimodal  óptimo, el cual consiste en un encadenamiento de modos de control. La propuesta realizada incluye el desarrollo y formulación de un algoritmo basado en la idea de la programación dinámica integrando procesos Gaussianos y aprendizaje Bayesiano activo. Mediante el enfoque propuesto es posible realizar un uso eficiente de los datos para mejorar la exploración de las soluciones sobre espacios de estados continuos. Un caso de estudio representativo es abordado para demostrar el desempeño del algoritmo propuesto.
publishDate 2015
dc.date.none.fl_str_mv 2015-10
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/6896
de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel; Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos; Elsevier; Revista Iberoamericana de Automatica E Informatica Industrial; 12; 4; 10-2015; 385-396
1697-7912
url http://hdl.handle.net/11336/6896
identifier_str_mv de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel; Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos; Elsevier; Revista Iberoamericana de Automatica E Informatica Industrial; 12; 4; 10-2015; 385-396
1697-7912
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://www.sciencedirect.com/science/article/pii/S1697791215000552
info:eu-repo/semantics/altIdentifier/url/http://goo.gl/yZeVQN
info:eu-repo/semantics/altIdentifier/doi/10.1016/j.riai.2015.09.004
info:eu-repo/semantics/altIdentifier/doi/
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-nd/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Elsevier
publisher.none.fl_str_mv Elsevier
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1842980658985566208
score 12.993085