Curso Telegraf for Observability

  • DevOps | CI | CD | Kubernetes | Web3

Curso Telegraf for Observability

24h
Visão Geral

Este curso aborda o uso do Telegraf como agente central de observabilidade, mostrando como coletar, processar e entregar métricas de forma confiável para apoiar práticas de Observabilidade, DevOps e SRE. O foco está em transformar dados brutos em sinais úteis para entender, operar e evoluir sistemas em produção.

Objetivo

Após realizar este curso, você será capaz de:

  • Utilizar o Telegraf como base de observabilidade
  • Coletar métricas relevantes para confiabilidade
  • Processar e enriquecer dados de telemetria
  • Integrar Telegraf a stacks de observabilidade
  • Operar Telegraf com foco em produção
  • Aplicar boas práticas de observabilidade moderna
Publico Alvo
  • Engenheiros de Observabilidade
  • Profissionais de DevOps e SRE
  • Administradores de Sistemas
  • Arquitetos de Infraestrutura
  • Profissionais que atuam em ambientes de produção
Pre-Requisitos
  • Conhecimento básico a intermediário de Telegraf
  • Noções de monitoramento e sistemas
  • Familiaridade com conceitos de DevOps
Conteúdo Programatico

Module 1 – Observability Foundations

  1. Monitoring vs observability
  2. Telemetry data types
  3. Signals and system understanding
  4. Observability mindset

Module 2 – Telegraf’s Role in Observability

  1. Telegraf as a telemetry agent
  2. Metrics collection architecture
  3. Plugin ecosystem overview
  4. Agent deployment patterns

Module 3 – Collecting High-Quality Metrics

  1. Infrastructure metrics
  2. Application metrics
  3. System and service signals
  4. Metric selection strategies

Module 4 – Processing and Enriching Telemetry

  1. Filtering noise
  2. Normalizing metrics
  3. Tag strategy for observability
  4. Aggregation for signal clarity

Module 5 – Delivering Metrics to Observability Stacks

  1. InfluxDB integration
  2. Prometheus remote write
  3. Kafka and streaming outputs
  4. Multi-destination delivery

Module 6 – Reliability and Performance

  1. High-frequency data handling
  2. Buffering and retry strategies
  3. Preventing data loss
  4. Performance tuning

Module 7 – Operating Telegraf in Production

  1. Configuration management
  2. Security and access control
  3. Monitoring Telegraf itself
  4. Troubleshooting pipelines

Module 8 – Observability Use Cases and Best Practices

  1. SRE-focused observability
  2. Incident detection and analysis
  3. Capacity planning
  4. Anti-patterns and lessons learned
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h