Curso DevOps and Site Reliability Engineering

24 horas

Visão Geral

Curso: DevOps and Site Reliability Engineering (SRE) Este curso combina os princípios fundamentais do DevOps e da Engenharia de Confiabilidade de Sites (SRE), proporcionando aos alunos uma compreensão abrangente de como as equipes de desenvolvimento e operações podem colaborar para melhorar a eficiência, reduzir falhas e aumentar a confiabilidade dos sistemas. O curso abrange desde automação de infraestrutura até monitoramento, alertas e práticas de SRE para garantir a disponibilidade e escalabilidade de aplicativos críticos.

Objetivo

Após realizar o curso DevOps and Site Reliability Engineering, você será capaz de:

Compreender a cultura e os princípios do DevOps e da SRE
Implementar pipelines de CI/CD para automação de builds e deploys
Gerenciar a infraestrutura como código usando ferramentas como Terraform e Ansible
Monitorar e manter a confiabilidade de sistemas em ambientes de produção
Utilizar técnicas de automação para melhorar a disponibilidade de serviços
Configurar sistemas de monitoramento e alerta para detecção precoce de falhas
Aplicar práticas de engenharia de confiabilidade, como SLOs, SLIs e SLAs
Trabalhar com ferramentas de observabilidade e logging para análise de desempenho

Publico Alvo

Engenheiros de DevOps
Engenheiros de SRE
Desenvolvedores de Software
Administradores de Sistemas
Arquitetos de Soluções
Profissionais interessados em melhorar a confiabilidade e automação em ambientes de TI

Pre-Requisitos

Familiaridade com sistemas operacionais (Linux/Windows)
Conhecimento básico de infraestrutura em nuvem
Experiência em ferramentas de automação e monitoramento

Materiais

Inglês/Português/Lab Prático

Conteúdo Programatico

Module 1: Introduction to DevOps and SRE

What is DevOps? Cultural and Technical Aspects
What is Site Reliability Engineering (SRE)?
The Relationship Between DevOps and SRE
Key Principles of SRE: Reliability, Scalability, and Automation

Module 2: CI/CD Pipeline Automation

Introduction to Continuous Integration and Continuous Deployment (CI/CD)
Tools for CI/CD: Jenkins, GitLab CI, CircleCI, etc.
Creating Pipelines for Automated Builds and Deployments
Best Practices for Managing CI/CD Pipelines

Module 3: Infrastructure as Code (IaC)

Introduction to IaC and Its Benefits in DevOps
Working with Terraform for Infrastructure Automation
Automating Configuration Management with Ansible
Case Studies: Implementing IaC in Cloud Environments

Module 4: Containerization and Orchestration

Introduction to Docker and Containers
Orchestrating Containers with Kubernetes
Managing Kubernetes Clusters: Deployment, Scaling, and Monitoring
Case Study: Deploying Microservices with Kubernetes

Module 5: Monitoring, Alerting, and Observability

Importance of Monitoring in DevOps and SRE
Tools for Monitoring: Prometheus, Grafana, and ELK Stack
Setting Up Alerts for Proactive Monitoring
Logging and Observability: Analyzing System Performance and Health

Module 6: SRE Concepts and Practices

Defining Service Level Objectives (SLOs) and Service Level Indicators (SLIs)
Error Budgets and Their Role in Managing Reliability
Implementing Redundancy and Failover Mechanisms
Balancing Reliability with Feature Velocity

Module 7: Automating Operations and Incident Response

Automating System Administration Tasks
Tools for Automating Incident Response (PagerDuty, OpsGenie)
Creating Playbooks for Handling Incidents
Post-Incident Reviews: Learning from Failures

Module 8: Scaling Infrastructure for Reliability

Designing Systems for Scalability
Horizontal vs. Vertical Scaling
Load Balancing and Traffic Distribution
Auto-scaling with Kubernetes and Cloud Providers

Module 9: Security and Compliance in DevOps

Integrating Security into DevOps Pipelines (DevSecOps)
Automating Security Testing in CI/CD Pipelines
Compliance and Governance in DevOps
Managing Secrets and Sensitive Data

Module 10: High Availability and Disaster Recovery

Designing Systems for High Availability
Backup and Disaster Recovery Planning
Implementing Active-Passive and Active-Active Architectures
Testing and Validating Disaster Recovery Plans

Module 11: Advanced SRE Techniques

Chaos Engineering: Testing System Resilience
Distributed Systems: Ensuring Reliability Across Multiple Datacenters
Reducing Toil with Automation and Self-Healing Systems
Continuous Improvement in SRE Practices

Module 12: Final Project and Case Studies

Real-world Case Study: Implementing DevOps and SRE in an Enterprise
Final Project: Building a CI/CD Pipeline with Reliability Practices
Course Summary and Best Practices
Q&A and Discussion on Future Trends in DevOps and SRE

32h

Ver Curso

Curso DevOps and Site Reliability Engineering

Curso DevOps and Site Reliability Engineering

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Docker Foundation

Curso Ansible Red Hat Basics Automation Technical Foundation

Curso Ansible Foundation

Curso Terraform Foundation

Curso Terraform Deploying to Oracle Cloud Infrastructure

Curso Ansible Linux Automation with Ansible

Curso Agile Product Owner

Curso Agile Fundamentals

Ansible Overview of Ansible architecture

Advanced Automation: Ansible Best Practices

O que você quer aprender hoje?

Curso DevOps and Site Reliability Engineering

Curso DevOps and Site Reliability Engineering

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Docker Foundation

Curso Ansible Red Hat Basics Automation Technical Foundation

Curso Ansible Foundation

Curso Terraform Foundation

Curso Terraform Deploying to Oracle Cloud Infrastructure

Curso Ansible Linux Automation with Ansible

Curso Agile Product Owner

Curso Agile Fundamentals

Ansible Overview of Ansible architecture

Advanced Automation: Ansible Best Practices