Curso Data Quality Engineering

  • DevOps | CI | CD | Kubernetes | Web3

Curso Data Quality Engineering

32 horas
Visão Geral

Curso Data Quality Engineering. Este curso aprofunda práticas, técnicas e arquiteturas para garantir qualidade de dados em plataformas modernas. O foco está em engenharia de qualidade aplicada a pipelines, tabelas analíticas e produtos de dados, tratando qualidade como um requisito técnico contínuo e mensurável.

Objetivo

Após realizar este curso Data Quality Engineering, você será capaz de:

  • Definir dimensões técnicas de qualidade de dados
  • Implementar validações automatizadas em pipelines
  • Monitorar qualidade de dados continuamente
  • Tratar qualidade como código
  • Detectar e corrigir problemas de dados em produção
  • Integrar qualidade com observabilidade e governança
  • Reduzir impacto de dados incorretos no negócio
Publico Alvo
  •  
  • Engenheiros de dados
  • Analytics engineers
  • Profissionais de BI
  • Arquitetos de dados
  • Profissionais responsáveis por qualidade de dados
  •  
Pre-Requisitos
  •  
  • Conhecimentos de engenharia de dados
  • Experiência com SQL
  • Noções de pipelines ETL ou ELT
  • Familiaridade com Python
  • Conceitos básicos de dados analíticos
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Data Quality Fundamentals

  1. What is data quality
  2. Why data quality fails
  3. Quality as an engineering problem
  4. Quality vs governance

Module 2: Data Quality Dimensions

  1. Accuracy
  2. Completeness
  3. Consistency
  4. Timeliness

Module 3: Data Validation Techniques

  1. Rule-based validation
  2. Schema validation
  3. Referential integrity
  4. Statistical checks

Module 4: Quality in Data Pipelines

  1. Ingestion validation
  2. Transformation checks
  3. Output validation
  4. Incremental quality

Module 5: Data Quality Monitoring

  1. Quality metrics
  2. Thresholds and alerts
  3. Anomaly detection
  4. Quality dashboards

Module 6: Data Quality Automation

  1. Quality as code
  2. CI/CD integration
  3. Automated remediation
  4. Backfill strategies

Module 7: Data Incidents and Resolution

  1. Detecting quality issues
  2. Root cause analysis
  3. Data incident response
  4. Preventive strategies

Module 8: Quality at Scale

  1. Multi-domain data quality
  2. Cost vs quality trade-offs
  3. Maturity models
  4. Production best practices
TENHO INTERESSE

Cursos Relacionados

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Ansible Overview of Ansible architecture

16h

Curso Real-Time Data Pipelines

24 horas

Curso Modern Data Platform Architecture

32 horas

Curso ISO/IEC 20000-1 Certification Service Management

24 horas

Curso Automotive Threat Analysis and Risk Assessment (TARA)

24 horas

Curso Secure Automotive Software Development

24 horas