Curso Site Reliability Engineering Foundation

  • DevOps | CI | CD | Kubernetes | Web3

Curso Site Reliability Engineering Foundation

16 horas
Visão Geral

O Curso Site Reliability Engineering Foundation, apresenta os princípios e práticas que permitem que uma organização dimensione serviços críticos de maneira confiável e econômica. A introdução de uma dimensão de confiabilidade local requer um realinhamento organizacional, um novo foco em engenharia e automação e a adoção de uma série de novos paradigmas de trabalho.

O Curso Site Reliability Engineering Foundation destaca a evolução do SRE e sua direção futura. Ele equipa os participantes com práticas, métodos e ferramentas para envolver pessoas de toda a organização envolvidas na confiabilidade e estabilidade evidenciadas por meio de cenários da vida real e histórias de casos. Após a conclusão do curso, os participantes terão lições tangíveis para aproveitar quando voltarem ao escritório, como compreensão, definição e acompanhamento de Objetivos de Nível de Serviço (SLOs).

Objetivo

Após realizar este Curso Site Reliability Engineering Foundation, você será capaz de:

  • A história do SRE e seu surgimento no Google
  • A inter-relação do SRE com DevOps e outras estruturas populares
  • Os princípios subjacentes ao SRE
  • Objetivos de nível de serviço (SLOs) e seu foco no usuário
  • Indicadores de nível de serviço (SLIs) e o cenário moderno de monitoramento
  • Orçamentos de erro e as políticas de orçamento de erro associadas
  • O trabalho árduo e seu efeito na produtividade de uma organização
  • Algumas etapas práticas que podem ajudar a eliminar o trabalho árduo
  • Observabilidade é algo que indica a saúde de um serviço
  • Ferramentas SRE, técnicas de automação e a importância da segurança
  • Antifragilidade, nossa abordagem para falhas e testes de falhas
  • O impacto organizacional que a introdução do SRE traz
Publico Alvo
  • Qualquer pessoa que esteja iniciando ou liderando um movimento em direção ao aumento da confiabilidade
  • Qualquer pessoa interessada em liderança moderna de TI (Tecnologia da Informação) e abordagens de mudança organizacional
  • Funções de trabalho: gerentes de negócios, partes interessadas de negócios, agentes de mudança, consultores, profissionais de DevOps, diretores/gerentes/líderes de equipe de TI, proprietários de produtos, Scrum Masters, engenheiros de software, engenheiros de confiabilidade de sites, integradores de sistemas, fornecedores de ferramentas
Materiais
Portugues/Inglês + Lab Pratico
Conteúdo Programatico

Introduction

  1. Course Goals
  2. Course Agenda

SRE Principles & Practices

  1. What is Site Reliability Engineering?
  2. SRE & DevOps: What is the Difference?
  3. SRE Principles & Practices

Service Level Objectives & Error Budgets

  1. Service Level Objectives (SLOs)
  2. Error Budgets
  3. Error Budget Policies

Reducing Toil

  1. What is Toil?
  2. Why is Toil Bad?
  3. Doing Something About Toil

Monitoring & Service Level Indicators

  1. Service Level Indicators (SLIs)
  2. Monitoring
  3. Observability

SRE Tools & Automation

  1. Automation Defined
  2. Automation Focus
  3. Hierarchy of Automation Types
  4. Secure Automation
  5. Automation Tools

Anti-Fragility & Learning from Failure

  1. Why Learn from Failure
  2. Benefits of Anti-Fragility
  3. Shifting the Organizational Balance

Organizational Impact of SRE

  1. Why Organizations Embrace SRE
  2. Patterns for SRE Adoption
  3. On-Call Necessities
  4. Blameless Post-Mortems
  5. SRE & Scale

SRE, Other Frameworks, The Future

  1. SRE & Other Frameworks
  2. The Future
  3. Additional Sources of Information
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h