Visão Geral
Deep Reinforcement Learning with Python: O Reinforcement Learning é um tipo de aprendizado de máquina que permite que máquinas e agentes de software atuem de forma inteligente e detectem automaticamente o comportamento ideal dentro de um ambiente específico, a fim de maximizar seu desempenho e produtividade.
O Aprendizado por Reforço está se tornando popular porque não serve apenas como uma forma de estudar como máquinas e agentes de software aprendem a agir, mas também é usado como uma ferramenta para construir sistemas autônomos que se aprimoram com a experiência.
Entre no domínio de ponta do Deep Reinforcement Learning (DRL) com nosso programa personalizado em cursos superiores. Começando com os conceitos fundamentais do Processo de Decisão de Markov (MDP) e Aprendizagem por Reforço (RL), garantimos uma compreensão profunda, preparando o terreno para assuntos mais avançados. Com exercícios práticos, os participantes compreenderão a dinâmica de RL usando ferramentas importantes como OpenAI Gym e Stable Baselines, abrindo caminho para a aplicação prática e compreensão.
Aventurando-se ainda mais, o curso cobre os meandros de algoritmos como Q-Learning, DQN, Policy Gradient, A2C, A3C e PPO. Redes de políticas personalizadas em bases estáveis enriquecem a experiência de aprendizagem, permitindo que os participantes ajustem e se adaptem de acordo com requisitos específicos. Concluindo com uma breve visão sobre RL baseada em modelo, este programa encapsula o amplo espectro de DRL, garantindo que os participantes estejam bem equipados para lidar com os desafios de IA do mundo real.
Conteúdo Programatico
Introduction to Reinforcement Learning
- Fundamental Concepts of Reinforcement Learning (RL)
- Types of RL Algorithms
- Applications of RL
- Markov Decision Process
OpenAI Gym and Stable Baselines
- Introduction to OpenAI Gym
- Install OpenAI Gym and Stable Baselines
- Create Agent and Policy on Gym
Value Based Q-Learning
- Overview of Value Based Learning
- Value Functions and Bellman's Equations
- Exploration Strategies
- Q-Learning Algorithm
- SARSA Algorithm
- Deep Q Network (DQN) Algorithm
Policy Based Learning
- Overview of Policy Based Learning
- Policy Network
- Policy Gradient Algorithm
Advanced RL Algorithms
- Actor-Critic A2C/A3C Algorithms
- Proximal Policy Gradient (PPO/PPO2)
Advanced Stable Baselines Techniques
- Custom Policy Networks
- Callbacks and Tensorboard
- Reinforcement Learning on Atari Games
- Reinforcement Learning on MuJoCo
Brief Introduction to Model-Based Learning
- What is Model-Based Learnings
- Monte Carlo Tree Search
- Brief Overview of AlphaZero