Curso Reliability Engineering Practitioner

  • DevOps | CI | CD | Kubernetes | Web3

Curso Reliability Engineering Practitioner

24 horas
Visão Geral

Curso Reliability Engineering Practitioner: Os profissionais de SRE entregam valor comercial aos clientes por meio da colaboração com equipes de DevOps e engenharia de ambientes de aplicativos e sistemas de software confiáveis ​​e seguros.

O curso Site Reliability Engineering Practitioner apresenta maneiras de escalar serviços de forma econômica e confiável em uma organização. Ele explora estratégias para melhorar a agilidade, a colaboração interfuncional e a transparência da saúde dos serviços em direção à construção de resiliência por design, automação e remediação de circuito fechado.

O Curso Reliability Engineering Practitioner, visa equipar os participantes com as práticas, métodos e ferramentas para envolver pessoas em toda a organização envolvidas em confiabilidade por meio do uso de cenários da vida real e histórias de caso. Após a conclusão do curso, os participantes terão lições tangíveis para alavancar quando voltarem ao escritório, como implementar modelos SRE que se ajustem ao seu contexto organizacional, construir observabilidade avançada em sistemas distribuídos, construir resiliência por design e respostas eficazes a incidentes usando práticas SRE.

O Curso Reliability Engineering Practitioner é desenvolvido alavancando fontes-chave de SRE, envolvendo-se com líderes de pensamento no espaço de SRE e trabalhando com organizações que adotam SRE para extrair as melhores práticas da vida real e foi projetado para ensinar os princípios e práticas-chave necessários para iniciar a adoção de SRE. Este curso posiciona os alunos para concluir com sucesso o exame de certificação SRE Practitioner.

Objetivo

Após a conclusão deste Curso Reliability Engineering Practitioner, os seguintes resultados de aprendizagem alcançados incluirão a compreensão prática de:

  • Visão prática para implementar com sucesso uma cultura SRE florescente em sua organização.
  • Princípios subjacentes do SRE e prevenção de antipadrões
  • O impacto organizacional da SRE
  • Dominando a arte de SLIs e SLOs em um ecossistema distribuído
  • Ampliando o uso de Orçamentos de Erros para inovar e evitar riscos
  • Construindo segurança e resiliência por design em um ambiente distribuído e de confiança zero
  • Implementando observabilidade de pilha completa, rastreamento distribuído e uma cultura de desenvolvimento orientada à observabilidade
  • Curadoria de dados usando IA para passar de gerenciamento de incidentes reativo para proativo e preditivo
  • Importância da Engenharia de Plataforma
  • Implementando a Engenharia do Caos prática
  • Principais responsabilidades de resposta a incidentes com base na estrutura de comando de incidentes
  • Entendendo por que o SRE pode ser considerado a implementação mais pura do DevOps
  • Modelo de execução SRE
  • Compreendendo o papel do SRE e por que a confiabilidade é um problema de todos
  • Aprendizados de histórias de sucesso de SRE
Publico Alvo
  • Qualquer pessoa focada em escalabilidade e confiabilidade de serviços em larga escala
  • Qualquer pessoa interessada em liderança moderna de TI e abordagens de mudança organizacional
  • Gestores de Negócios e Partes Interessadas
  • Agentes de Mudança
  • Consultores
  • Praticantes de DevOps
  • Diretores de TI, gerentes, líderes de equipe
  • Proprietários de produtos, Scrum Masters
  • Engenheiros de Software
  • Engenheiros de confiabilidade do site
  • Integradores de sistemas
  • Fornecedores de ferramentas
Pre-Requisitos

É altamente recomendável que os alunos frequentem o curso SRE Foundation com um DevOps Institute Education Partner credenciado antes de frequentar o curso SRE Practitioner. É recomendado um entendimento e conhecimento da terminologia comum de SRE, conceitos, princípios e experiência de trabalho relacionada.

Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

SRE Anti-patterns

  1. SRE in a distributed ecosystem
  2. Avoiding SRE antipatterns

SLO is a proxy for customer happiness

  1. What has changed with SLOs?
  2. SLIs and system boundaries
  3. Error Budgets, velocity and risk

Building secure and reliable systems

  1. Non-Abstract Large Scale Design
  2. Fault-tolerant designs
  3. Designing for security, resiliency, scalability and changing landscapes

Full-stack observability

  1. Pillars of Observability
  2. Observability MELT
  3. Using Open Telemetry

Platform Engineering and AIOps

  1. Platform-centric approaches
  2. Using DataOps and AIOps to improve resiliency
  3. AIOps Simple Recipe

SRE & Incident Response Management

  1. Incident Command Framework
  2. OODA Loop
  3. SRE and closed-loop remediation
  4. AI/ML and Swarming for better incident management

Chaos Engineering

  1. Chaos Engineering Defined
  2. Myths of Chaos
  3. Chaos Engineering Experiments and Resources
  4. Game Day Basics and Exercises

SRE is the purest form of DevOps

  1. Key Principles of SRE
  2. Metrics for Success
  3. SRE Execution Models
  4. Culture and behavioral skills
  5. Transformations and SRE
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h