Curso Observability for data platforms

  • DevOps | CI | CD | Kubernetes | Web3

Curso Observability for data platforms

24 horas
Visão Geral

Este curso aborda os fundamentos e práticas avançadas de observabilidade aplicadas a plataformas de dados modernas. O foco está em garantir confiabilidade, performance, rastreabilidade e qualidade operacional de pipelines de dados, engines de processamento e camadas analíticas. O aluno aprenderá a observar sistemas de dados de ponta a ponta por meio de métricas, logs, traces e indicadores de qualidade, preparando plataformas para operação em produção e ambientes críticos de negócio.

Objetivo

Após realizar este Curso Observability for Data Platforms, você será capaz de:

  • Compreender os pilares da observabilidade em plataformas de dados
  • Implementar métricas, logs e traces em pipelines de dados
  • Monitorar confiabilidade, latência e throughput de sistemas de dados
  • Detectar falhas e anomalias em pipelines analíticos
  • Medir e acompanhar SLAs, SLOs e SLIs de dados
  • Aplicar observabilidade orientada à qualidade de dados
  • Estruturar alertas eficazes e reduzir ruído operacional
  • Preparar plataformas de dados para operação em produção
Publico Alvo
  • Engenheiros de dados
  • Arquitetos de dados
  • Analytics engineers
  • Profissionais de SRE e DevOps de dados
  • Profissionais responsáveis por plataformas de dados em produção
Pre-Requisitos
  • Conhecimentos sólidos de engenharia de dados
  • Experiência com pipelines ETL ou ELT
  • Noções de sistemas distribuídos
  • Familiaridade com SQL e Python
  • Conhecimento básico de orquestração de workflows
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Observability Fundamentals

  1. What is observability
  2. Observability vs monitoring
  3. Data platforms observability challenges
  4. Modern observability principles

Module 2: Data Platform Architecture Overview

  1. Ingestion layers
  2. Processing and transformation engines
  3. Storage and analytics layers
  4. End-to-end data flow

Module 3: Metrics for Data Platforms

  1. Pipeline performance metrics
  2. Latency and throughput
  3. Volume and freshness metrics
  4. Resource utilization

Module 4: Logging Strategies

  1. Structured logs
  2. Log levels and standards
  3. Correlation and context
  4. Debugging with logs

Module 5: Distributed Tracing

  1. Traces and spans
  2. End-to-end pipeline tracing
  3. Dependency visualization
  4. Bottleneck identification

Module 6: Data Quality Observability

  1. Data quality dimensions
  2. Freshness and completeness
  3. Validity and consistency
  4. Quality metrics and alerts

Module 7: Reliability and Alerting

  1. SLIs, SLOs and SLAs for data
  2. Alert fatigue and tuning
  3. Incident detection
  4. On-call strategies

Module 8: Observability in Orchestrated Pipelines

  1. Observability in workflow orchestration
  2. DAG-level visibility
  3. Task-level metrics
  4. Failure propagation

Module 9: Operating Observability at Scale

  1. High-cardinality data
  2. Cost and retention strategies
  3. Multi-environment observability
  4. Scaling observability platforms

Module 10: Best Practices and Real-World Scenarios

  1. Designing observable data platforms
  2. Common anti-patterns
  3. Maturity models
  4. Preparing for production excellence
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h