Curso Lakehouse em Producao com Governanca e Qualidade

  • DevOps | CI | CD | Kubernetes | Web3

Curso Lakehouse em Producao com Governanca e Qualidade

32 horas
Visão Geral

Curso Lakehouse em Producao com Governanca e Qualidade. Este curso aborda a operação de arquiteturas Lakehouse em ambientes produtivos, com foco em governança de dados, qualidade, segurança, auditoria e confiabilidade. O aluno aprenderá como estruturar camadas de dados, aplicar controles de acesso, garantir qualidade e rastreabilidade, além de preparar pipelines e tabelas Lakehouse para uso corporativo, atendendo requisitos técnicos, regulatórios e de negócio.

Objetivo

Após realizar este Curso Lakehouse em Produção com Governança e Qualidade, você será capaz de:

  • Operar arquiteturas Lakehouse em ambientes produtivos
  • Implementar governança de dados em plataformas Lakehouse
  • Aplicar controles de qualidade e validação de dados
  • Estruturar camadas Bronze, Silver e Gold de forma governada
  • Garantir rastreabilidade, auditoria e linhagem de dados
  • Implementar segurança e controle de acesso a dados
  • Preparar pipelines confiáveis e observáveis
  • Atender requisitos de compliance e boas práticas corporativas
Publico Alvo
  •  
  • Engenheiros de dados
  • Arquitetos de dados
  • Analytics engineers
  • Profissionais de BI e plataformas de dados
  • Profissionais de TI responsáveis por dados em produção
  •  
Pre-Requisitos
  • Conhecimentos sólidos de engenharia de dados
  • Experiência com pipelines ETL ou ELT
  • Noções de arquiteturas de dados modernas
  • Familiaridade com ambientes distribuídos
  • Conhecimento básico de SQL e Python
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Lakehouse Production Fundamentals

  1. Production data platform requirements
  2. Characteristics of enterprise Lakehouse
  3. Batch and incremental processing
  4. Operational challenges

Module 2: Data Governance Foundations

  1. What is data governance
  2. Governance frameworks
  3. Roles and responsibilities
  4. Policies and standards

Module 3: Lakehouse Data Modeling

  1. Bronze, Silver and Gold layers
  2. Table design strategies
  3. Schema evolution
  4. Data contracts

Module 4: Data Quality Management

  1. Data quality dimensions
  2. Validation rules
  3. Data profiling
  4. Quality monitoring

Module 5: Metadata, Lineage and Catalog

  1. Metadata management
  2. Data lineage concepts
  3. Data catalogs
  4. Discoverability and documentation

Module 6: Security and Access Control

  1. Authentication and authorization
  2. Role-based access control
  3. Data masking and encryption
  4. Secure data sharing

Module 7: Reliability and Observability

  1. Monitoring pipelines
  2. Logging and metrics
  3. Incident handling
  4. Backfill and recovery strategies

Module 8: Compliance and Auditability

  1. Regulatory requirements
  2. Audit trails
  3. Data retention policies
  4. Privacy and compliance controls

Module 9: Operating Lakehouse at Scale

  1. Performance optimization
  2. Cost management
  3. Environment isolation
  4. Scaling strategies

Module 10: Best Practices and Real-World Scenarios

  1. End-to-end governed Lakehouse
  2. Common pitfalls
  3. Maturity models
  4. Preparing for advanced governance
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h