Curso SRE Site Reliability Engineering
16 horasVisão Geral
Curso SRE Site Reliability Engineering. Monitorar um serviço que você implantou é um aspecto fundamental para fornecer produtos de qualidade ao seu cliente, mas decidir quais parâmetros monitorar não é tão fácil.
Venha aprender os princípios básicos do SRE e como você pode monitorar o desempenho de seus produtos para atingir seus objetivos.
Publico Alvo
- Proprietários de produtos
- Engenheiros DevOps
- Gerentes de operações
- Desenvolvedores de software
- Gerentes de incidentes e mudanças
- Administradores de sistema
- Arquitetos de TI
Pre-Requisitos
- Não há pré-requisitos
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Introduction
- The SRE principles
- Defining SLOs and how they can help you
- How you make SLOs work for your business
Reliability
- What reliability means and why we need it
- SLOs vs SLAs
- Testing and how to measure reliability
- Setting you targets (100% is not possible)
- How to iterate over your SLOs and targets
Trade-offs for reliability
- How many errors can we afford?
- Choosing the right trade-off
- Axes of improvement
- How to increase reliability
Choosing a good SLI
- Properties of good SLI metrics
- How to measure SLIs
- Request/Response/Data processing SLIs
- Managing complex systems — data aggregation, bucketing
- Achievable SLO
- Aspirational SLO
- Improve!
Automation and tools
- Why automation is good and how much time do we want to spend on it
- Continuous Delivery concepts
- Basics of container operation with Docker
- Revision control with Git
- Continuous Integration with Jenkins
- Docker and how it can simplify Continuous Integration pipelines
- Packaging applications with Docker
- Continuous automated testing
- Using Kubernetes to run applications at scale