Curso Observabilidade, DevOps e SRE

  • DevOps | CI | CD | Kubernetes | Web3

Curso Observabilidade, DevOps e SRE

30h
Visão Geral

 

Este curso apresenta os fundamentos e práticas de Observabilidade, DevOps e Site Reliability Engineering (SRE), mostrando como esses pilares trabalham juntos para garantir sistemas confiáveis, escaláveis e resilientes. O foco está em conceitos sólidos, práticas operacionais reais e tomada de decisão baseada em dados.

Objetivo

Após realizar este curso, você será capaz de:

  • Compreender os fundamentos de Observabilidade
  • Entender a cultura e práticas de DevOps
  • Aplicar conceitos essenciais de SRE
  • Relacionar métricas, logs e traces com confiabilidade
  • Melhorar a estabilidade e a operação de sistemas
  • Tomar decisões técnicas baseadas em dados
Publico Alvo
  • Profissionais de DevOps
  • Engenheiros de SRE
  • Administradores de Sistemas
  • Desenvolvedores
  • Estudantes de Tecnologia
Pre-Requisitos
  • Noções básicas de sistemas operacionais
  • Conceitos introdutórios de redes
  • Conhecimento básico de desenvolvimento ou infraestrutura
Conteúdo Programatico

Module 1 – Foundations of Modern Operations

  1. Evolution of IT operations
  2. Problems of traditional operations
  3. DevOps culture and principles
  4. Reliability as a business requirement

Module 2 – DevOps Core Concepts

  1. Continuous Integration and Continuous Delivery
  2. Infrastructure as Code fundamentals
  3. Automation and configuration management
  4. Collaboration and shared ownership

Module 3 – Introduction to Observability

  1. Monitoring vs observability
  2. Metrics, logs and traces
  3. Telemetry data types
  4. Observability-driven operations

Module 4 – Site Reliability Engineering (SRE) Fundamentals

  1. What is SRE
  2. SRE vs traditional operations
  3. Reliability engineering principles
  4. Error budgets concept

Module 5 – Metrics and Service Level Management

  1. SLIs, SLOs and SLAs
  2. Choosing meaningful metrics
  3. Golden signals
  4. Service health evaluation

Module 6 – Incident Management and Reliability

  1. Incident response lifecycle
  2. On-call practices
  3. Postmortems and blameless culture
  4. Continuous improvement

Module 7 – Observability Tooling and Architecture

  1. Observability stack overview
  2. Data pipelines for telemetry
  3. Tool integration concepts
  4. Scalability considerations

Module 8 – Real-World DevOps and SRE Scenarios

  1. High availability architectures
  2. Failure scenarios and resilience
  3. Production best practices
  4. Common anti-patterns
TENHO INTERESSE

Cursos Relacionados

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Ansible Overview of Ansible architecture

16h

Curso Apache NiFi e Hadoop DataFlow Engineering

40 horas

Curso Apache Kafka Data Streaming

24 horas

Curso Python Software Development

24 horas