نبذة مختصرة : A Aprendizagem por Reforço (AR) tem se mostrado um método bastante eficiente quando se trata da resolução de problemas onde é necessário aprender um comportamento de atuação a partir de um ambiente desconhecido. Existem várias aplicações desse método nas mais diferentes áreas de pesquisa, uma dessas aplicações tem chamado muito a atenção de pesquisadores da área de computação, que é a capacidade criar agentes autônomos utilizando a Aprendizagem por Reforço. Existem diversos algoritmos de AR que podem ser aplicados a tarefas de aprendizagem, tendo como objetivo determinar uma política ótima de atuação para um agente. Este trabalho se propõe a realizar um estudo dos algoritmos de Aprendizagem por Reforço aplicado a problemas de navegação autônoma. Para isso, foi realizado um levantamento bibliográfico sobre o tema e implementados dois algoritmos bastante populares na literatura, Q-learning e Sarsa, buscando analisá-los quanto à capacidade de convergência para uma política de atuação ótima e seus desempenhos na aplicação em um modelo de navegação autônoma, que busca aprender a desviar de obstáculos e atingir um objetivo pré-determinado. Foi utilizado o software SCILAB para simulação do ambiente desenvolvido e implementação dos algoritmos de AR, os resultados obtidos nos testes de ambos os algoritmos foram analisados quanto à capacidade de aprendizado autônomo do agente na busca do objetivo determinado, onde foram feita mudanças nos parâmetros das equações de aprendizagem e comparado os resultados, a fim de obter o melhor desempenho. Os algoritmos apresentaram resultados distintos para cada variação dos parâmetros na realização da mesma tarefa no ambiente desenvolvido, com destaque para o algoritmo Sarsa, que se mostrou mais sensível às variações. Assim, o desempenho para uma aplicação de Aprendizagem por Reforço depende tanto dos algoritmos utilizados como dos parâmetros utilizados. ; Reinforcement Learning (RL) has proven to be a very efficient method when solving problems where it is necessary to learn a behavior ...
No Comments.