Curso InfluxDB for DevOps and SRE

  • DevOps | CI | CD | Kubernetes | Web3

Curso InfluxDB for DevOps and SRE

16 horas
Visão Geral

O curso InfluxDB for DevOps and SRE é focado na utilização do InfluxDB como plataforma central de métricas e observabilidade em ambientes DevOps e Site Reliability Engineering. O treinamento aborda como coletar, armazenar, consultar e visualizar métricas críticas para confiabilidade, performance e capacidade, capacitando o participante a aplicar o InfluxDB em pipelines CI/CD, monitoramento de aplicações, infraestrutura e práticas de SRE.

Objetivo

Após realizar este curso InfluxDB for DevOps and SRE, você será capaz de:

  • Aplicar conceitos de observabilidade em ambientes DevOps
  • Coletar métricas de infraestrutura, aplicações e pipelines
  • Utilizar o InfluxDB para análise de confiabilidade e performance
  • Criar métricas para SLIs, SLOs e indicadores de erro
  • Analisar capacidade, latência e disponibilidade
  • Integrar o InfluxDB com ferramentas DevOps
  • Aplicar boas práticas de SRE utilizando dados de séries temporais
Publico Alvo
  • Profissionais de DevOps
  • Site Reliability Engineers (SRE)
  • Engenheiros de plataforma
  • Administradores de sistemas
  • Engenheiros de observabilidade
Pre-Requisitos
  • Conhecimentos básicos de DevOps e SRE
  • Noções de monitoramento e métricas
  • Experiência introdutória com InfluxDB (desejável)
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico

Module 1: DevOps and SRE Observability Concepts

  1. DevOps and SRE Principles
  2. Observability vs Monitoring
  3. Metrics in Reliability Engineering
  4. Time Series in DevOps Environments

Module 2: InfluxDB in DevOps Architectures

  1. Role of InfluxDB in CI/CD
  2. Metrics Collection Strategies
  3. Push vs Pull Models
  4. Common DevOps Use Cases

Module 3: Collecting Metrics with Telegraf

  1. Infrastructure Metrics Collection
  2. Application Metrics
  3. Container and Platform Metrics
  4. Custom Metrics for Pipelines

Module 4: Reliability Metrics and SRE Practices

  1. SLIs, SLOs, and Error Budgets
  2. Availability and Latency Metrics
  3. Capacity and Saturation Metrics
  4. Defining Reliability Indicators

Module 5: Querying and Analyzing DevOps Metrics

  1. Querying Metrics for SRE
  2. Trend and Anomaly Analysis
  3. Incident and Postmortem Metrics
  4. Performance Analysis Techniques

Module 6: Visualization and Dashboards for SRE

  1. SRE-Focused Dashboards
  2. Reliability and Health Indicators
  3. Capacity Planning Dashboards
  4. Operational Readiness Views

Module 7: Performance, Scaling, and Automation

  1. Performance Optimization Strategies
  2. Scaling InfluxDB for DevOps
  3. Automating Metrics Collection
  4. Integrating with Alerting Systems

Module 8: DevOps and SRE Use Cases and Labs

  1. CI/CD Pipeline Monitoring
  2. Infrastructure Reliability Scenario
  3. Incident Analysis Workshop
  4. Hands-On Labs and Exercises
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h