Engenharia de Observabilidade Arquitetura Enterprise Alta Escala e Multi-Cloud

  • DevOps | CI | CD | Kubernetes | Web3

Engenharia de Observabilidade Arquitetura Enterprise Alta Escala e Multi-Cloud

32 horas
Visão Geral

Este curso Engenharia de Observabilidade Arquitetura Enterprise  Alta Escala e Multi-Cloud, forma especialistas em engenharia de observabilidade com foco em arquiteturas enterprise, ambientes de alta escala e cenários multi-cloud. A abordagem integra práticas modernas de monitoramento, tracing, logging e métricas, alinhadas a estratégias de confiabilidade, performance e resiliência de sistemas distribuídos.

Serão explorados conceitos avançados como telemetria distribuída, arquiteturas orientadas a eventos, engenharia de confiabilidade (SRE) e observabilidade como pilar estratégico para transformação digital. O curso utiliza tecnologias amplamente adotadas como OpenTelemetry, Prometheus, Grafana e Elastic Stack, aplicadas em ambientes multi-cloud como Amazon Web Services, Microsoft Azure e Google Cloud Platform.

O foco é preparar o profissional para projetar, implementar e operar plataformas de observabilidade robustas, escaláveis e resilientes em organizações complexas.

Objetivo

Após realizar este Curso Engenharia de Observabilidade (Arquitetura Enterprise, Alta Escala e Multi-Cloud), você será capaz de:

  • Projetar arquiteturas de observabilidade para ambientes enterprise
  • Implementar estratégias de observabilidade em alta escala
  • Integrar logs, métricas e traces em uma visão unificada
  • Utilizar OpenTelemetry para coleta padronizada de telemetria
  • Construir plataformas multi-cloud resilientes e observáveis
  • Definir SLIs, SLOs e SLAs alinhados ao negócio
  • Automatizar monitoramento e resposta a incidentes
  • Implementar práticas de engenharia de confiabilidade (SRE)
  • Otimizar custos e performance em observabilidade
Publico Alvo
  • Engenheiros DevOps e SRE
  • Arquitetos de soluções e arquitetos cloud
  • Engenheiros de plataforma (Platform Engineers)
  • Profissionais de infraestrutura e operações (IT Ops)
  • Especialistas em monitoramento e observabilidade
  • Profissionais de segurança (SecOps)
Pre-Requisitos
  • Conhecimento intermediário de redes e sistemas distribuídos
  • Experiência com ambientes Linux
  • Noções de cloud computing
  • Conhecimento básico de containers (Docker/Kubernetes)
  • Conceitos de logs, métricas e monitoramento
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico

Module 1: Foundations of Observability Engineering

  1. Observability vs Monitoring vs APM
  2. Pillars of observability (logs, metrics, traces)
  3. Observability in distributed systems
  4. Challenges in modern architectures

Module 2: Enterprise Observability Architecture

  1. Designing observability architectures for large organizations
  2. Centralized vs decentralized observability models
  3. Data pipelines and telemetry flow
  4. Governance and standardization

Module 3: Telemetry Collection with OpenTelemetry

  1. OpenTelemetry architecture and components
  2. Instrumentation (auto and manual)
  3. Collectors and exporters
  4. Standardizing telemetry across environments

Module 4: Metrics at Scale with Prometheus

  1. Prometheus architecture and data model
  2. Service discovery and scraping
  3. Scaling Prometheus (federation, remote write)
  4. Long-term storage strategies

Module 5: Distributed Tracing

  1. Concepts of distributed tracing
  2. Trace context propagation
  3. Using tracing tools (Jaeger/Tempo)
  4. Troubleshooting microservices with traces

Module 6: Log Management at Enterprise Scale

  1. Centralized logging strategies
  2. Log ingestion pipelines
  3. Indexing and querying large volumes
  4. Cost optimization and retention policies

Module 7: Visualization and Observability UX

  1. Building dashboards in Grafana
  2. Correlating logs, metrics and traces
  3. Designing observability for decision making
  4. Advanced visualization techniques

Module 8: SRE and Reliability Engineering

  1. SLIs, SLOs and error budgets
  2. Incident management lifecycle
  3. Postmortem culture
  4. Chaos engineering fundamentals

Module 9: Multi-Cloud Observability

  1. Observability challenges in multi-cloud
  2. Cross-cloud telemetry aggregation
  3. Vendor lock-in avoidance strategies
  4. Hybrid and multi-region architectures

Module 10: Automation, AIOps and Advanced Practices

  1. Alerting strategies and noise reduction
  2. Automation and self-healing systems
  3. Introduction to AIOps
  4. Integrating observability with CI/CD pipelines
TENHO INTERESSE

Cursos Relacionados

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Ansible Overview of Ansible architecture

16h

Running Kubernetes Workloads on Serverless Containers

24 horas

Curso Algorithms and Data Structures

24 horas

Curso Python Data Structures and Collections

24 horas

Curso Python Logic and Algorithms

24 horas

Curso OpenStack High Availability Architecture

24 horas