Curso Databricks Advanced Data Engineering with Databricks

  • RPA | IA | AGI | ASI | ANI | IoT | PYTHON | DEEP LEARNING

Curso Databricks Advanced Data Engineering with Databricks

16 horas
Visão Geral

Neste Curso Databricks Advanced Data Engineering with Databricks, os alunos aproveitarão seu conhecimento existente de Apache Spark, Structured Streaming e Delta Lake para desbloquear todo o potencial do data lakehouse, utilizando o conjunto de ferramentas fornecido pelo Databricks. Este Curso Databricks Advanced Data Engineering with Databricks dá grande ênfase aos projetos que favorecem o processamento incremental de dados, permitindo que sistemas otimizados ingeram e analisem continuamente dados cada vez maiores. Ao projetar cargas de trabalho que aproveitam otimizações de plataforma integradas, os engenheiros de dados podem reduzir a carga de manutenção de código e emergências de plantão e adaptar rapidamente o código de produção a novas demandas com refatoração ou tempo de inatividade mínimos. 

Objetivo

Após realizar este Curso Databricks Advanced Data Engineering with Databricks com êxito você será capaz de:

  • Projete bancos de dados e pipelines otimizados para a plataforma Databricks Lakehouse
  • Implementar processamento de dados incremental eficiente para validar e enriquecer dados que orientam decisões de negócios e aplicações
  • Aproveite os recursos nativos do Databricks para gerenciar o acesso a dados confidenciais e atender às solicitações do direito de ser esquecido
  • Gerencie solução de problemas de erros, promoção de código, orquestração de tarefas e monitoramento de trabalhos de produção usando ferramentas Databricks
Pre-Requisitos
  • Experiência no uso de APIs PySpark para realizar transformações avançadas de dados
  • Familiaridade na implementação de classes com Python
  • Experiência no uso de SQL em implementações de data warehouse de produção ou data lake
  • Experiência trabalhando em notebooks Databricks e configurando clusters
  • Familiaridade com a criação e manipulação de dados em tabelas Delta Lake com SQL
Materiais
Inglês + Exercícios + Lab Pratico
Conteúdo Programatico
  1. The Lakehouse Architecture
  2. Optimizing Data Storage
  3. Understanding Delta Lake Transactions
  4. Delta Lake Isolation with Optimistic Concurrency
  5. Streaming Design Patterns
  6. Clone for Development and Data Backup
  7. Auto Loader and Bronze Ingestion Patterns
  8. Streaming Deduplication and Quality Enforcement
  9. Slowly Changing Dimensions
  10. Streaming Joins and Statefulness
  11. Stored and Materialized Views
  12. Storing Data Securely
  13. Granting Privileged Access to PII
  14. Deleting Data in the Lakehouse
  15. Orchestration and Scheduling with Multi-Task Jobs
  16. Monitoring, Logging, and Handling Errors
  17. Promoting Code with Databricks Repos
  18. Programmatic Platform Interactions (Databricks CLI and REST API)
  19. Managing Costs and Latency with Streaming Workloads
TENHO INTERESSE

Cursos Relacionados

Curso AI ML Toolkits with Kubeflow Foundation

24 horas

Curso Container Management with Docker

24 Horas

Curso Machine Learning Python & R In Data Science

32 Horas

Curso Docker for Developers and System Administrators

16 horas

Curso artificial inteligence AI for Everyone Foundation

16 horas

Curso IA Inteligência Artificial e Código Aberto Foundation

16 horas

Curso Artificial Intelligence with Azure

24 Horas

Curso RPA Robotic Process Automation Industria 4.0

32 horas