Curso Telegraf for System and Infrastructure Monitoring

  • DevOps | CI | CD | Kubernetes | Web3

Curso Telegraf for System and Infrastructure Monitoring

20h
Visão Geral

Este curso ensina como utilizar o Telegraf para monitoramento de sistemas e infraestrutura, cobrindo a coleta de métricas essenciais de servidores, sistemas operacionais e componentes de infraestrutura. O foco está na construção de uma base sólida de monitoramento, seguindo práticas tradicionais e amplamente utilizadas em ambientes corporativos.

Objetivo

Após realizar este curso, você será capaz de:

  • Monitorar servidores Linux e Windows com Telegraf
  • Coletar métricas de CPU, memória, disco e rede
  • Configurar inputs específicos para infraestrutura
  • Organizar métricas para análise e visualização
  • Detectar gargalos e problemas de performance
  • Aplicar boas práticas de monitoramento contínuo
Publico Alvo
  • Profissionais de infraestrutura e DevOps
  • Administradores de sistemas
  • Engenheiros de observabilidade
  • Técnicos de suporte e operações
  • Estudantes de TI
Pre-Requisitos
  • Conhecimento básico de Telegraf
  • Noções de sistemas operacionais
  • Conceitos introdutórios de monitoramento
Conteúdo Programatico

Module 1 – Fundamentals of Infrastructure Monitoring

  1. What is infrastructure monitoring
  2. Key system metrics
  3. Monitoring vs observability basics
  4. Traditional monitoring principles

Module 2 – Telegraf for System Monitoring

  1. Telegraf role in infrastructure monitoring
  2. System input plugins overview
  3. Agent deployment strategies
  4. Single host vs fleet monitoring

Module 3 – CPU and Memory Monitoring

  1. CPU usage metrics
  2. Load average concepts
  3. Memory and swap monitoring
  4. Interpreting performance indicators

Module 4 – Disk and Filesystem Monitoring

  1. Disk usage metrics
  2. Disk I/O performance
  3. Filesystem monitoring strategies
  4. Identifying storage bottlenecks

Module 5 – Network Monitoring

  1. Network traffic metrics
  2. Interface monitoring
  3. Error and packet loss detection
  4. Network performance analysis

Module 6 – Process and Service Monitoring

  1. Process-level metrics
  2. Critical service monitoring
  3. Uptime and availability metrics
  4. Resource consumption per service

Module 7 – Scaling Infrastructure Monitoring

  1. Monitoring multiple servers
  2. Standardized configurations
  3. Tagging strategies for infrastructure
  4. Performance considerations at scale

Module 8 – Troubleshooting and Best Practices

  1. Diagnosing infrastructure issues
  2. Common monitoring mistakes
  3. Alerting readiness basics
  4. Maintaining reliable monitoring
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h