Curso Data Quality Engineering

  • DevOps | CI | CD | Kubernetes | Web3

Curso Data Quality Engineering

32 horas
Visão Geral

Curso Data Quality Engineering. Este curso aprofunda práticas, técnicas e arquiteturas para garantir qualidade de dados em plataformas modernas. O foco está em engenharia de qualidade aplicada a pipelines, tabelas analíticas e produtos de dados, tratando qualidade como um requisito técnico contínuo e mensurável.

Objetivo

Após realizar este curso Data Quality Engineering, você será capaz de:

  • Definir dimensões técnicas de qualidade de dados
  • Implementar validações automatizadas em pipelines
  • Monitorar qualidade de dados continuamente
  • Tratar qualidade como código
  • Detectar e corrigir problemas de dados em produção
  • Integrar qualidade com observabilidade e governança
  • Reduzir impacto de dados incorretos no negócio
Publico Alvo
  •  
  • Engenheiros de dados
  • Analytics engineers
  • Profissionais de BI
  • Arquitetos de dados
  • Profissionais responsáveis por qualidade de dados
  •  
Pre-Requisitos
  •  
  • Conhecimentos de engenharia de dados
  • Experiência com SQL
  • Noções de pipelines ETL ou ELT
  • Familiaridade com Python
  • Conceitos básicos de dados analíticos
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Data Quality Fundamentals

  1. What is data quality
  2. Why data quality fails
  3. Quality as an engineering problem
  4. Quality vs governance

Module 2: Data Quality Dimensions

  1. Accuracy
  2. Completeness
  3. Consistency
  4. Timeliness

Module 3: Data Validation Techniques

  1. Rule-based validation
  2. Schema validation
  3. Referential integrity
  4. Statistical checks

Module 4: Quality in Data Pipelines

  1. Ingestion validation
  2. Transformation checks
  3. Output validation
  4. Incremental quality

Module 5: Data Quality Monitoring

  1. Quality metrics
  2. Thresholds and alerts
  3. Anomaly detection
  4. Quality dashboards

Module 6: Data Quality Automation

  1. Quality as code
  2. CI/CD integration
  3. Automated remediation
  4. Backfill strategies

Module 7: Data Incidents and Resolution

  1. Detecting quality issues
  2. Root cause analysis
  3. Data incident response
  4. Preventive strategies

Module 8: Quality at Scale

  1. Multi-domain data quality
  2. Cost vs quality trade-offs
  3. Maturity models
  4. Production best practices
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h