Navegación autónoma mediante aprendizaje por refuerzo

Autores: Costa, Ignacio Agustín; De Leo, Esteban José; Sattolo, Iris Inés; Panizzi, Marisa D.
Año de publicación: 2020
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.
Workshop: WASI – Agentes y Sistemas Inteligentes
Red de Universidades con Carreras en Informática
Materia: Ciencias Informáticas
Aprendizaje por refuerzo
Red neuronal artificial
RA
q-learning
Resolución de laberintos
Exploración de estructuras desconocidas
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/113262

Acceder

id	SEDICI_4e5268c84e539aa96b3618134275cce9
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/113262
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Navegación autónoma mediante aprendizaje por refuerzoCosta, Ignacio AgustínDe Leo, Esteban JoséSattolo, Iris InésPanizzi, Marisa D.Ciencias InformáticasAprendizaje por refuerzoRed neuronal artificialRAq-learningResolución de laberintosExploración de estructuras desconocidasExisten diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.Workshop: WASI – Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática2020-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf41-50http://sedici.unlp.edu.ar/handle/10915/113262spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9info:eu-repo/semantics/reference/hdl/10915/113243info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:20:33Zoai:sedici.unlp.edu.ar:10915/113262Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:20:33.598SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Navegación autónoma mediante aprendizaje por refuerzo
title	Navegación autónoma mediante aprendizaje por refuerzo
spellingShingle	Navegación autónoma mediante aprendizaje por refuerzo Costa, Ignacio Agustín Ciencias Informáticas Aprendizaje por refuerzo Red neuronal artificial RA q-learning Resolución de laberintos Exploración de estructuras desconocidas
title_short	Navegación autónoma mediante aprendizaje por refuerzo
title_full	Navegación autónoma mediante aprendizaje por refuerzo
title_fullStr	Navegación autónoma mediante aprendizaje por refuerzo
title_full_unstemmed	Navegación autónoma mediante aprendizaje por refuerzo
title_sort	Navegación autónoma mediante aprendizaje por refuerzo
dc.creator.none.fl_str_mv	Costa, Ignacio Agustín De Leo, Esteban José Sattolo, Iris Inés Panizzi, Marisa D.
author	Costa, Ignacio Agustín
author_facet	Costa, Ignacio Agustín De Leo, Esteban José Sattolo, Iris Inés Panizzi, Marisa D.
author_role	author
author2	De Leo, Esteban José Sattolo, Iris Inés Panizzi, Marisa D.
author2_role	author author author
dc.subject.none.fl_str_mv	Ciencias Informáticas Aprendizaje por refuerzo Red neuronal artificial RA q-learning Resolución de laberintos Exploración de estructuras desconocidas
topic	Ciencias Informáticas Aprendizaje por refuerzo Red neuronal artificial RA q-learning Resolución de laberintos Exploración de estructuras desconocidas
dc.description.none.fl_txt_mv	Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos. Workshop: WASI – Agentes y Sistemas Inteligentes Red de Universidades con Carreras en Informática
description	Existen diversas situaciones, como derrumbes edilicias o catástrofes, en donde seres vivos quedan atrapados y su supervivencia depende de encontrar el camino de salida del lugar. Este trabajo presenta el diseño e implementación de un sistema de aprendizaje mediante la utilización de Redes Neuronales Artificiales (RNA) con aprendizaje por refuerzo, con el propósito de resolver laberintos de estructura desconocida con un robot autónomo (RA). Se definieron un conjunto de políticas y puntajes para llevar acabo el aprendizaje por parte del agente, y posteriormente encontrar la solución buscada. La RNA fue implementada sobre las librerías Tensorflow y Keras. El RA es comandado por Arduino, el cual se comunica con una aplicación de escritorio. Finalmente, se diseñó una maqueta adaptable a cualquier laberinto para poder ejecutar la resolución mediante el RA. Los resultados indican que el aprendizaje por refuerzo es apropiado para resolver esta problemática, dado que es adaptable a problemas complejos.
publishDate	2020
dc.date.none.fl_str_mv	2020-10
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/113262
url	http://sedici.unlp.edu.ar/handle/10915/113262
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9 info:eu-repo/semantics/reference/hdl/10915/113243
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 41-50
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866371781031362560
score	13.468372

Navegación autónoma mediante aprendizaje por refuerzo

Publicaciones similares