Um currículo de aprendizado por reforço para o cenário “Run to Score with Keeper” do Google Research Football Environment

Sampaio, Pablo AzevedoSilva, Jonatan Washington Pereira da2023-02-142023-02-142019-12-10SILVA, Jonatan Washington Pereira da. Um currículo de aprendizado por reforço para o cenário “Run to Score with Keeper” do Google Research Football Environment. 2019. 49 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2019.https://repository.ufrpe.br/handle/123456789/3954O aprendizado por reforço é um conjunto de técnicas que permitem a um agente interagir com um determinado ambiente. Os agentes observam o estado do ambiente e executam uma ação, a ação é avaliada por meio de uma recompensa obtida. O agente tem como objetivo maximizar esta recompensa. Diversas questões como: locomoção em três dimensões e jogos eletrônicos foram abordados pelo aprendizado por reforço (KURACH et al., 2019). O treinamento de agentes para um jogo de futebol normalmente possui recompensas esparsas, o que retarda o aprendizado (MATIISEN et al., 2019). Uma técnica que pode contornar este obstaculo é o aprendizado por currículo proposto em (BENGIO et al., 2009). O aprendizado por currículo é uma técnica que aborda sub-tarefas mais simples da tarefa principal e aumenta gradativamente o nível de dificuldade ao longo do tempo. Neste trabalho apresentamos dois currículos, identificados como: 5-15-30-50 e 3-10-20-67, para o cenário Run to Score with Keeper da Football Academy. Mostramos que os currículos, em média, obtiveram melhores resultados se comparados ao treinamento apenas no cenário principal, sem currículo. O currículo 3-10-20-67 obteve um melhor resultado mesmo considerando o desvio padrão.49 f.poropenAccesshttps://creativecommons.org/licenses/by-nd/4.0/deed.ptMarkov, Processos deRedes neurais (Computação)Algoritmos computacionaisUm currículo de aprendizado por reforço para o cenário “Run to Score with Keeper” do Google Research Football EnvironmentbachelorThesisAtribuição-SemDerivações 4.0 Internacional (CC BY-ND 4.0)https://n2t.net/ark:/57462/001300000kcpt