Curso High Availability Outputs with Telegraf

  • DevOps | CI | CD | Kubernetes | Web3

Curso High Availability Outputs with Telegraf

18h
Visão Geral

Este curso aborda estratégias de alta disponibilidade na entrega de métricas utilizando outputs do Telegraf, ensinando como projetar pipelines resilientes, tolerantes a falhas e preparados para ambientes críticos. O foco está em evitar perda de dados, isolar falhas e garantir continuidade operacional mesmo com indisponibilidade parcial de destinos.

Objetivo

Após realizar este curso, você será capaz de:

  • Projetar outputs altamente disponíveis com Telegraf
  • Implementar estratégias de redundância e failover
  • Isolar falhas entre múltiplos destinos
  • Minimizar perda de dados em cenários críticos
  • Ajustar buffers e retries para alta confiabilidade
  • Aplicar boas práticas de alta disponibilidade
Publico Alvo
  • Engenheiros de Observabilidade
  • Profissionais de DevOps e SRE
  • Arquitetos de Sistemas e Dados
  • Administradores de Infraestrutura
  • Profissionais que operam Telegraf em produção
Pre-Requisitos
  • Conhecimento intermediário de Telegraf
  • Familiaridade com output plugins
  • Noções de arquitetura distribuída
Conteúdo Programatico

Module 1 – High Availability Concepts for Data Pipelines

  1. What high availability means for metrics
  2. Availability vs durability vs consistency
  3. Failure scenarios in output delivery
  4. Traditional HA design principles

Module 2 – Telegraf Output Reliability Model

  1. Output plugin execution lifecycle
  2. Buffering and retry mechanisms
  3. Flush behavior under failure
  4. Delivery guarantees and limitations

Module 3 – Redundant Output Architectures

  1. Active-active output patterns
  2. Active-passive configurations
  3. Multi-endpoint outputs
  4. Trade-offs and design decisions

Module 4 – Failover and Failure Isolation

  1. Detecting output failures
  2. Preventing cascading failures
  3. Output isolation strategies
  4. Partial delivery handling

Module 5 – Buffering, Queues and Backpressure

  1. Memory vs disk buffering
  2. Handling slow or unavailable destinations
  3. Backpressure mitigation
  4. Data loss prevention techniques

Module 6 – High Availability with Common Outputs

  1. InfluxDB HA delivery patterns
  2. Kafka cluster-based resilience
  3. MQTT broker redundancy
  4. HTTP endpoint failover

Module 7 – Monitoring and Testing HA Outputs

  1. Observing output health
  2. Telegraf internal metrics
  3. Failure simulation and chaos testing
  4. Alerting strategies

Module 8 – Production-Grade HA Design Scenarios

  1. Observability pipelines
  2. Mission-critical infrastructure monitoring
  3. Industrial and IoT environments
  4. Best practices and common pitfalls
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h