Curso AWS SageMaker
24 horasVisão Geral
Este Curso AWS SageMaker prático e abrangente foi desenvolvido para cientistas de dados, engenheiros de Machine Learning (ML), desenvolvedores, arquitetos de dados e qualquer profissional de I.A. que deseja dominar o Amazon SageMaker, o serviço da AWS que simplifica o ciclo de vida completo do Machine Learning. Do ponto de vista técnico, você aprenderá a usar o SageMaker para todas as etapas: preparação de dados, construção e treinamento de modelos, ajuste de hiperparâmetros, implantação, monitoramento e automação. Abordaremos o uso de notebooks Jupyter, algoritmos integrados do SageMaker, frameworks populares (TensorFlow, PyTorch, Scikit-learn), SageMaker Pipelines para MLOps, SageMaker Feature Store e SageMaker Model Monitor. O foco será em cenários do mundo real, garantindo que os participantes possam colocar modelos de ML em produção de forma escalável e eficiente na AWS.
Curso Machine Learning com Amazon SageMaker Do Modelo à Produção, a capacidade de acelerar o desenvolvimento e a implantação de modelos de Machine Learning é um diferencial competitivo enorme. O domínio do Amazon SageMaker permite que as organizações reduzam o tempo de ciclo de ML, melhorem a qualidade dos modelos, otimizem custos de infraestrutura e aumentem a produtividade das equipes de I.A./ML. Ao padronizar e automatizar o fluxo de trabalho de ML, as empresas podem escalar suas iniciativas de inteligência artificial, impulsionar a inovação e extrair mais valor de seus dados. Profissionais com experiência em SageMaker são altamente procurados, pois são essenciais para transformar protótipos de ML em soluções de produção robustas e impactantes.
Objetivo
Ao final do Curso AWS SageMaker (Curso Machine Learning com Amazon SageMaker Do Modelo à Produção), você será capaz de:
- Compreender o ciclo de vida do Machine Learning e como o SageMaker o otimiza.
- Navegar e utilizar os principais componentes do Amazon SageMaker (Notebook Instances, Training Jobs, Endpoints, etc.).
- Preparar e transformar dados usando SageMaker Processing Jobs e Feature Store.
- Construir e treinar modelos de ML usando algoritmos integrados do SageMaker e frameworks populares (TensorFlow, PyTorch).
- Realizar ajuste de hiperparâmetros (HPO) para otimizar o desempenho do modelo.
- Implantar modelos em endpoints em tempo real e para inferência em lote.
- Monitorar modelos em produção usando SageMaker Model Monitor para detecção de desvios.
- Automatizar o fluxo de trabalho de ML com SageMaker Pipelines e integrar com MLOps.
- Aplicar as melhores práticas para otimização de custos e segurança no SageMaker.
Publico Alvo
- Cientistas de Dados e Engenheiros de ML: Que desejam operacionalizar e escalar seus modelos na AWS.
- Desenvolvedores: Que buscam integrar ML em suas aplicações usando serviços AWS gerenciados.
- Arquitetos de Dados e Cloud: Para projetar soluções de ML escaláveis e robustas.
- Analistas de Dados: Que querem explorar a capacidade de ML para insights avançados.
Pre-Requisitos
- Conhecimento básico de Python: Para scripting e manipulação de dados.
- Conhecimento básico de Machine Learning: Conceitos de treinamento, validação, teste, algoritmos supervisionados/não supervisionados.
- Conhecimento básico de AWS: Familiaridade com o Console de Gerenciamento da AWS, S3, IAM.
- Noções de linha de comando (terminal).
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Módulo 1: Introdução ao Amazon SageMaker e o Ciclo de Vida do ML (4 horas)
- 1.1. O Desafio do Machine Learning em Produção:
- Por que ML é difícil de escalar e gerenciar.
- A necessidade de MLOps.
- 1.2. Visão Geral do Amazon SageMaker:
- Como o SageMaker simplifica o ciclo de vida do ML.
- Principais componentes e serviços (Studio, Notebooks, Training, Endpoints, etc.).
- 1.3. Navegando no Amazon SageMaker Studio e Notebook Instances:
- Configuração e uso do SageMaker Studio.
- Criando e gerenciando Notebook Instances.
- Visão geral da SDK do SageMaker para Python.
- 1.4. Preparação de Dados na AWS:
- Armazenamento de dados no Amazon S3 para ML.
- Noções básicas de permissões IAM para SageMaker.
- Prática: Configurar um ambiente SageMaker Studio/Notebook Instance. Carregar um dataset simples para o S3. Executar um notebook Jupyter básico no SageMaker.
Módulo 2: Preparação de Dados e Engenharia de Features (4 horas)
- 2.1. SageMaker Processing Jobs:
- Executando scripts de processamento de dados escaláveis (Scikit-learn, Spark).
- Pré-processamento, transformação e validação de dados.
- 2.2. Amazon SageMaker Feature Store:
- O que é e por que usar uma Feature Store.
- Criando Feature Groups para dados offline e online.
- Ingestão e recuperação de features.
- 2.3. Data Wrangling com SageMaker Data Wrangler:
- Ferramenta visual para preparação de dados.
- Transformações e exportação para outros serviços.
- Prática: Criar um SageMaker Processing Job para pré-processar um dataset. Criar um Feature Group no SageMaker Feature Store e ingeri-lo.
Módulo 3: Treinamento de Modelos no SageMaker (6 horas)
- 3.1. Algoritmos Integrados do SageMaker:
- Visão geral de algoritmos populares (XGBoost, Linear Learner, K-Means).
- Configuração e execução de Training Jobs com algoritmos integrados.
- 3.2. Treinamento com Frameworks de ML (Bring Your Own Script):
- Usando TensorFlow, PyTorch e Scikit-learn no SageMaker.
- Estrutura de scripts de treinamento.
- Configurando Estimators para diferentes frameworks.
- 3.3. Treinamento Distribuído:
- Conceitos de treinamento distribuído para modelos grandes.
- Configurando treinamento em múltiplos nós.
- 3.4. Debugging de Modelos com SageMaker Debugger:
- Monitoramento de tensões e detecção de anomalias durante o treinamento.
- Prática: Treinar um modelo (ex: XGBoost) usando um algoritmo integrado. Treinar um modelo (ex: um modelo de classificação simples com Scikit-learn ou TensorFlow) usando seu próprio script.
Módulo 4: Ajuste de Hiperparâmetros e Implantação de Modelos (6 horas)
- 4.1. Ajuste de Hiperparâmetros (HPO) com SageMaker Automatic Model Tuning:
- Definindo ranges de hiperparâmetros e métricas de otimização.
- Estratégias de busca (Bayesian Optimization, Random Search).
- 4.2. Registro e Versão de Modelos com SageMaker Model Registry:
- Criando e gerenciando versões de modelos.
- Aprovações de modelos para implantação.
- 4.3. Implantação de Endpoints em Tempo Real:
- Criando Endpoints, Endpoints Configurataions e Models.
- Inferência online: Requisições síncronas.
- Configurações de implantação (instâncias, auto scaling).
- Atualização de modelos em Endpoints (Blue/Green Deployment).
- 4.4. Inferência em Lote com SageMaker Batch Transform:
- Processando grandes volumes de dados offline.
- Casos de uso para inferência em lote.
- Prática: Configurar um trabalho de HPO para otimizar um modelo. Registrar um modelo no Model Registry. Implamentar um modelo em um endpoint em tempo real e fazer inferência. Executar um trabalho de Batch Transform.
Módulo 5: Monitoramento de Modelos e MLOps com SageMaker (4 horas)
- 5.1. Monitoramento de Modelos em Produção com SageMaker Model Monitor:
- Detecção de data drift e model drift.
- Configurando baselines e schedules de monitoramento.
- Notificações e alertas.
- 5.2. Automação do Ciclo de Vida do ML com SageMaker Pipelines:
- Definindo pipelines de ML (steps: processing, training, model registration, deployment).
- Integração com CodePipeline/CodeBuild.
- 5.3. MLOps (Machine Learning Operations) na AWS:
- Construindo um pipeline de MLOps de ponta a ponta.
- Ferramentas e práticas para automação, CI/CD para ML.
- 5.4. Segurança e Otimização de Custos no SageMaker:
- Controles de acesso IAM para SageMaker.
- Criptografia de dados e modelos.
- Estratégias de otimização de custos (instâncias spot, instâncias gerenciadas, desligamento de recursos).
- Prática: Configurar o SageMaker Model Monitor para detectar desvios em um endpoint implantado. Construir e executar um SageMaker Pipeline simples.