Navegación autónoma mediante aprendizaje por refuerzo

Autores
Costa, Ignacio Agustín; De Leo, Esteban José; Sattolo, Iris Inés; Panizzi, Marisa D.
Año de publicación
2020
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.
Workshop: WASI – Agentes y Sistemas Inteligentes
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Aprendizaje por refuerzo
Red neuronal artificial
RA
q-learning
Resolución de laberintos
Exploración de estructuras desconocidas
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/113262

id SEDICI_4e5268c84e539aa96b3618134275cce9
oai_identifier_str oai:sedici.unlp.edu.ar:10915/113262
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Navegación autónoma mediante aprendizaje por refuerzoCosta, Ignacio AgustínDe Leo, Esteban JoséSattolo, Iris InésPanizzi, Marisa D.Ciencias InformáticasAprendizaje por refuerzoRed neuronal artificialRAq-learningResolución de laberintosExploración de estructuras desconocidasExisten diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.Workshop: WASI – Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática2020-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf41-50http://sedici.unlp.edu.ar/handle/10915/113262spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9info:eu-repo/semantics/reference/hdl/10915/113243info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:26:24Zoai:sedici.unlp.edu.ar:10915/113262Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:26:24.699SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Navegación autónoma mediante aprendizaje por refuerzo
title Navegación autónoma mediante aprendizaje por refuerzo
spellingShingle Navegación autónoma mediante aprendizaje por refuerzo
Costa, Ignacio Agustín
Ciencias Informáticas
Aprendizaje por refuerzo
Red neuronal artificial
RA
q-learning
Resolución de laberintos
Exploración de estructuras desconocidas
title_short Navegación autónoma mediante aprendizaje por refuerzo
title_full Navegación autónoma mediante aprendizaje por refuerzo
title_fullStr Navegación autónoma mediante aprendizaje por refuerzo
title_full_unstemmed Navegación autónoma mediante aprendizaje por refuerzo
title_sort Navegación autónoma mediante aprendizaje por refuerzo
dc.creator.none.fl_str_mv Costa, Ignacio Agustín
De Leo, Esteban José
Sattolo, Iris Inés
Panizzi, Marisa D.
author Costa, Ignacio Agustín
author_facet Costa, Ignacio Agustín
De Leo, Esteban José
Sattolo, Iris Inés
Panizzi, Marisa D.
author_role author
author2 De Leo, Esteban José
Sattolo, Iris Inés
Panizzi, Marisa D.
author2_role author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Aprendizaje por refuerzo
Red neuronal artificial
RA
q-learning
Resolución de laberintos
Exploración de estructuras desconocidas
topic Ciencias Informáticas
Aprendizaje por refuerzo
Red neuronal artificial
RA
q-learning
Resolución de laberintos
Exploración de estructuras desconocidas
dc.description.none.fl_txt_mv Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.
Workshop: WASI – Agentes y Sistemas Inteligentes
Red de Universidades con Carreras en Informática
description Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.
publishDate 2020
dc.date.none.fl_str_mv 2020-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/113262
url http://sedici.unlp.edu.ar/handle/10915/113262
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9
info:eu-repo/semantics/reference/hdl/10915/113243
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
41-50
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616141946748928
score 13.070432