Curso Observabilidade, DevOps e SRE

  • DevOps | CI | CD | Kubernetes | Web3

Curso Observabilidade, DevOps e SRE

30h
Visão Geral

 

Este curso apresenta os fundamentos e práticas de Observabilidade, DevOps e Site Reliability Engineering (SRE), mostrando como esses pilares trabalham juntos para garantir sistemas confiáveis, escaláveis e resilientes. O foco está em conceitos sólidos, práticas operacionais reais e tomada de decisão baseada em dados.

Objetivo

Após realizar este curso, você será capaz de:

  • Compreender os fundamentos de Observabilidade
  • Entender a cultura e práticas de DevOps
  • Aplicar conceitos essenciais de SRE
  • Relacionar métricas, logs e traces com confiabilidade
  • Melhorar a estabilidade e a operação de sistemas
  • Tomar decisões técnicas baseadas em dados
Publico Alvo
  • Profissionais de DevOps
  • Engenheiros de SRE
  • Administradores de Sistemas
  • Desenvolvedores
  • Estudantes de Tecnologia
Pre-Requisitos
  • Noções básicas de sistemas operacionais
  • Conceitos introdutórios de redes
  • Conhecimento básico de desenvolvimento ou infraestrutura
Conteúdo Programatico

Module 1 – Foundations of Modern Operations

  1. Evolution of IT operations
  2. Problems of traditional operations
  3. DevOps culture and principles
  4. Reliability as a business requirement

Module 2 – DevOps Core Concepts

  1. Continuous Integration and Continuous Delivery
  2. Infrastructure as Code fundamentals
  3. Automation and configuration management
  4. Collaboration and shared ownership

Module 3 – Introduction to Observability

  1. Monitoring vs observability
  2. Metrics, logs and traces
  3. Telemetry data types
  4. Observability-driven operations

Module 4 – Site Reliability Engineering (SRE) Fundamentals

  1. What is SRE
  2. SRE vs traditional operations
  3. Reliability engineering principles
  4. Error budgets concept

Module 5 – Metrics and Service Level Management

  1. SLIs, SLOs and SLAs
  2. Choosing meaningful metrics
  3. Golden signals
  4. Service health evaluation

Module 6 – Incident Management and Reliability

  1. Incident response lifecycle
  2. On-call practices
  3. Postmortems and blameless culture
  4. Continuous improvement

Module 7 – Observability Tooling and Architecture

  1. Observability stack overview
  2. Data pipelines for telemetry
  3. Tool integration concepts
  4. Scalability considerations

Module 8 – Real-World DevOps and SRE Scenarios

  1. High availability architectures
  2. Failure scenarios and resilience
  3. Production best practices
  4. Common anti-patterns
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h