Curso Deep Reinforcement Learning with Python
16 horasVisão Geral
Deep Reinforcement Learning with Python: O Reinforcement Learning é um tipo de aprendizado de máquina que permite que máquinas e agentes de software atuem de forma inteligente e detectem automaticamente o comportamento ideal dentro de um ambiente específico, a fim de maximizar seu desempenho e produtividade.
O Aprendizado por Reforço está se tornando popular porque não serve apenas como uma forma de estudar como máquinas e agentes de software aprendem a agir, mas também é usado como uma ferramenta para construir sistemas autônomos que se aprimoram com a experiência.
Entre no domínio de ponta do Deep Reinforcement Learning (DRL) com nosso programa personalizado em cursos superiores. Começando com os conceitos fundamentais do Processo de Decisão de Markov (MDP) e Aprendizagem por Reforço (RL), garantimos uma compreensão profunda, preparando o terreno para assuntos mais avançados. Com exercícios práticos, os participantes compreenderão a dinâmica de RL usando ferramentas importantes como OpenAI Gym e Stable Baselines, abrindo caminho para a aplicação prática e compreensão.
Aventurando-se ainda mais, o curso cobre os meandros de algoritmos como Q-Learning, DQN, Policy Gradient, A2C, A3C e PPO. Redes de políticas personalizadas em bases estáveis enriquecem a experiência de aprendizagem, permitindo que os participantes ajustem e se adaptem de acordo com requisitos específicos. Concluindo com uma breve visão sobre RL baseada em modelo, este programa encapsula o amplo espectro de DRL, garantindo que os participantes estejam bem equipados para lidar com os desafios de IA do mundo real.
Objetivo
Ao final deste Curso Deep Reinforcement Learning with Python, os participantes serão capazes de:
- Compreender os principais conceitos por trás do Deep Reinforcement Learning e ser capaz de distingui-lo do Machine Learning
- Aplique algoritmos avançados de Aprendizado por Reforço para resolver problemas do mundo real
- Construa um Agente de Aprendizado Profundo
Publico Alvo
- Engenheiros
- Engenheiros de visão computacional
- Cientistas
Pre-Requisitos
- Proficiência em Python
- Uma compreensão do cálculo universitário e da álgebra linear
- Compreensão básica de probabilidade e estatística
- Experiência na criação de modelos de aprendizado de máquina em Python e Numpy
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Introduction to Reinforcement Learning
- Fundamental Concepts of Reinforcement Learning (RL)
- Types of RL Algorithms
- Applications of RL
- Markov Decision Process
OpenAI Gym and Stable Baselines
- Introduction to OpenAI Gym
- Install OpenAI Gym and Stable Baselines
- Create Agent and Policy on Gym
Value Based Q-Learning
- Overview of Value Based Learning
- Value Functions and Bellman's Equations
- Exploration Strategies
- Q-Learning Algorithm
- SARSA Algorithm
- Deep Q Network (DQN) Algorithm
Policy Based Learning
- Overview of Policy Based Learning
- Policy Network
- Policy Gradient Algorithm
Advanced RL Algorithms
- Actor-Critic A2C/A3C Algorithms
- Proximal Policy Gradient (PPO/PPO2)
Advanced Stable Baselines Techniques
- Custom Policy Networks
- Callbacks and Tensorboard
- Reinforcement Learning on Atari Games
- Reinforcement Learning on MuJoCo
Brief Introduction to Model-Based Learning
- What is Model-Based Learnings
- Monte Carlo Tree Search
- Brief Overview of AlphaZero