Curso Enterprise Observability with Prometheus and Thanos

  • DevOps | CI | CD | Kubernetes | Web3

Curso Enterprise Observability with Prometheus and Thanos

24 horas
Visão Geral

O curso Enterprise Observability with Prometheus and Thanos aborda a construção de plataformas corporativas de observabilidade capazes de monitorar infraestruturas distribuídas em grande escala. O treinamento apresenta arquiteturas modernas baseadas no Prometheus combinadas com o Thanos para fornecer alta disponibilidade, retenção de métricas de longo prazo e consultas globais em ambientes multi-cluster.

Durante o curso, os participantes aprenderão a projetar arquiteturas de observabilidade para ambientes corporativos, integrando coleta de métricas, armazenamento distribuído e visualização avançada utilizando Grafana. Serão explorados conceitos como federation, sharding, armazenamento em object storage, replicação de métricas e consultas distribuídas.

O treinamento também apresenta boas práticas utilizadas por equipes de DevOps, SRE e Platform Engineering para construir plataformas de observabilidade resilientes que suportem milhares de serviços e clusters Kubernetes. Ao final do curso, os participantes estarão preparados para projetar e operar ambientes de monitoramento altamente escaláveis e confiáveis.

Objetivo

Após realizar este Curso Enterprise Observability with Prometheus and Thanos, você será capaz de:

  • Projetar arquiteturas corporativas de observabilidade
  • Implementar armazenamento de métricas de longo prazo
  • Implementar alta disponibilidade para ambientes Prometheus
  • Integrar Prometheus com Thanos para escalabilidade
  • Monitorar múltiplos clusters Kubernetes
  • Criar consultas globais de métricas distribuídas
  • Construir plataformas corporativas de observabilidade
Publico Alvo
  • Engenheiros DevOps
  • Site Reliability Engineers (SRE)
  • Engenheiros de plataforma
  • Arquitetos de infraestrutura cloud
  • Administradores de Kubernetes
  • Engenheiros de observabilidade
Pre-Requisitos
  • Conhecimento de monitoramento com Prometheus
  • Experiência com Linux
  • Noções de containers e Kubernetes
  • Conhecimentos básicos de observabilidade
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico

Module 1: Enterprise Observability Concepts

  1. Observability at enterprise scale
  2. Metrics, logs and tracing architecture
  3. Limitations of standalone Prometheus
  4. Distributed monitoring challenges
  5. Enterprise observability design principles

Module 2: Prometheus Architecture for Enterprise Environments

  1. Prometheus architecture review
  2. Scaling Prometheus deployments
  3. Federation vs sharding strategies
  4. Multi-cluster monitoring models
  5. Observability platform architecture

Module 3: Introduction to Thanos Architecture

  1. Thanos architecture overview
  2. Thanos sidecar component
  3. Thanos store gateway
  4. Thanos querier architecture
  5. Thanos compactor functions

Module 4: Long-Term Metrics Storage

  1. Prometheus local storage limitations
  2. Integrating object storage backends
  3. S3 compatible storage architecture
  4. Metrics retention strategies
  5. Historical metrics analysis

Module 5: High Availability Monitoring Architecture

  1. Prometheus HA pairs
  2. Deduplication of time series
  3. Global query architecture
  4. Load balancing monitoring queries
  5. Resilient monitoring systems

Module 6: Multi-Cluster Kubernetes Monitoring

  1. Monitoring multiple Kubernetes clusters
  2. Cross-cluster metrics aggregation
  3. Observability for hybrid cloud environments
  4. Global service monitoring
  5. Cluster-level reliability metrics

Module 7: Querying Distributed Metrics

  1. Global queries with Thanos Querier
  2. Aggregating metrics across clusters
  3. Performance considerations for queries
  4. Optimizing distributed queries
  5. Troubleshooting metrics queries

Module 8: Visualization and Dashboards

  1. Integrating Grafana with Thanos
  2. Global observability dashboards
  3. Cross-cluster metrics visualization
  4. Enterprise dashboard design
  5. Visualization best practices

Module 9: Operating Observability Platforms

  1. Managing observability infrastructure
  2. Security and access control
  3. Monitoring the monitoring platform
  4. Backup and disaster recovery
  5. Operational best practices

Module 10: Enterprise Observability Best Practices

  1. Designing scalable observability platforms
  2. Platform engineering and observability
  3. Cost optimization strategies
  4. Governance for observability platforms
  5. Future trends in enterprise observability
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h