Visão Geral
O Curso Databricks DevOps for Pipelines foi desenvolvido para profissionais que desejam integrar práticas DevOps em seus fluxos de trabalho de dados usando a plataforma Databricks. Ao longo do curso, os participantes aprenderão a construir, testar, automatizar e gerenciar pipelines de dados com foco em integração contínua (CI), entrega contínua (CD), automação com APIs e controle de versões com ferramentas como Git, Azure DevOps e GitHub Actions.
Conteúdo Programatico
Módulo 1 – Introdução ao Databricks com foco em DevOps
- Visão geral do Databricks para pipelines
- Arquitetura orientada a automação
- Princípios DevOps aplicados a DataOps e MLOps
Módulo 2 – Versionamento de Código e Integração com Git
- Integração de Databricks com GitHub, GitLab e Azure Repos
- Branches, pull requests e merge em projetos de dados
- Organização de projetos com notebooks versionados
Módulo 3 – Automatizando com Databricks CLI e REST API
- Instalação e configuração do Databricks CLI
- Uso da REST API para deploy de notebooks, jobs e clusters
- Scripts de automação para CI/CD
Módulo 4 – CI/CD com GitHub Actions e Azure DevOps
- Estrutura de pipelines YAML para Databricks
- Execução de testes automatizados em notebooks
- Deploy automatizado de notebooks e jobs em múltiplos workspaces
- Integração com workflows externos
Módulo 5 – Testes e Qualidade de Código
- Estruturação de testes unitários em notebooks
- Frameworks de teste para Python e Scala
- Validação de dados em pipelines
Módulo 6 – Gerenciamento de Ambientes e Deploys
- Estratégias de deploy por ambiente (dev, staging, prod)
- Gerenciamento de configurações com notebooks parametrizados
- Controle de acesso e permissões para automação
Módulo 7 – Monitoramento e Observabilidade
- Logs, métricas e alertas para pipelines Databricks
- Integração com ferramentas de monitoramento
- Estratégias de troubleshooting em ambientes automatizados
Módulo 8 – Projeto Final
- Implementação completa de um pipeline DevOps com Databricks
- Versionamento, testes e deploy automatizado
- Apresentação e validação dos resultados