Visão Geral
O Curso Site Reliability Engineering Foundation, apresenta os princípios e práticas que permitem que uma organização dimensione serviços críticos de maneira confiável e econômica. A introdução de uma dimensão de confiabilidade local requer um realinhamento organizacional, um novo foco em engenharia e automação e a adoção de uma série de novos paradigmas de trabalho.
O Curso Site Reliability Engineering Foundation destaca a evolução do SRE e sua direção futura. Ele equipa os participantes com práticas, métodos e ferramentas para envolver pessoas de toda a organização envolvidas na confiabilidade e estabilidade evidenciadas por meio de cenários da vida real e histórias de casos. Após a conclusão do curso, os participantes terão lições tangíveis para aproveitar quando voltarem ao escritório, como compreensão, definição e acompanhamento de Objetivos de Nível de Serviço (SLOs).
Objetivo
Após realizar este Curso Site Reliability Engineering Foundation, você será capaz de:
- A história do SRE e seu surgimento no Google
- A inter-relação do SRE com DevOps e outras estruturas populares
- Os princípios subjacentes ao SRE
- Objetivos de nível de serviço (SLOs) e seu foco no usuário
- Indicadores de nível de serviço (SLIs) e o cenário moderno de monitoramento
- Orçamentos de erro e as políticas de orçamento de erro associadas
- O trabalho árduo e seu efeito na produtividade de uma organização
- Algumas etapas práticas que podem ajudar a eliminar o trabalho árduo
- Observabilidade é algo que indica a saúde de um serviço
- Ferramentas SRE, técnicas de automação e a importância da segurança
- Antifragilidade, nossa abordagem para falhas e testes de falhas
- O impacto organizacional que a introdução do SRE traz
Publico Alvo
- Qualquer pessoa que esteja iniciando ou liderando um movimento em direção ao aumento da confiabilidade
- Qualquer pessoa interessada em liderança moderna de TI (Tecnologia da Informação) e abordagens de mudança organizacional
- Funções de trabalho: gerentes de negócios, partes interessadas de negócios, agentes de mudança, consultores, profissionais de DevOps, diretores/gerentes/líderes de equipe de TI, proprietários de produtos, Scrum Masters, engenheiros de software, engenheiros de confiabilidade de sites, integradores de sistemas, fornecedores de ferramentas
Materiais
Portugues/Inglês + Lab Pratico
Conteúdo Programatico
Introduction
- Course Goals
- Course Agenda
SRE Principles & Practices
- What is Site Reliability Engineering?
- SRE & DevOps: What is the Difference?
- SRE Principles & Practices
Service Level Objectives & Error Budgets
- Service Level Objectives (SLOs)
- Error Budgets
- Error Budget Policies
Reducing Toil
- What is Toil?
- Why is Toil Bad?
- Doing Something About Toil
Monitoring & Service Level Indicators
- Service Level Indicators (SLIs)
- Monitoring
- Observability
SRE Tools & Automation
- Automation Defined
- Automation Focus
- Hierarchy of Automation Types
- Secure Automation
- Automation Tools
Anti-Fragility & Learning from Failure
- Why Learn from Failure
- Benefits of Anti-Fragility
- Shifting the Organizational Balance
Organizational Impact of SRE
- Why Organizations Embrace SRE
- Patterns for SRE Adoption
- On-Call Necessities
- Blameless Post-Mortems
- SRE & Scale
SRE, Other Frameworks, The Future
- SRE & Other Frameworks
- The Future
- Additional Sources of Information
TENHO INTERESSE