Dynatrace Site Reliability Engineering SRE

Curso Dynatrace Site Reliability Engineering SRE

24 horas

Visão Geral

O curso Dynatrace Site Reliability Engineering (SRE) apresenta como utilizar a plataforma de observabilidade Dynatrace para implementar práticas modernas de confiabilidade de serviços baseadas nos princípios de Site Reliability Engineering. O treinamento demonstra como equipes de operações e engenharia podem utilizar monitoramento inteligente para melhorar disponibilidade, desempenho e estabilidade de aplicações críticas.

Durante o curso, os participantes aprenderão a utilizar métricas de confiabilidade, análise de performance e detecção automática de incidentes para gerenciar serviços em ambientes complexos. Também serão explorados recursos de inteligência artificial da plataforma Dynatrace, incluindo análise automática de causas raiz através do mecanismo Davis AI.

Além disso, o treinamento apresenta como monitorar aplicações distribuídas executando em ambientes cloud e plataformas como Kubernetes, permitindo análise detalhada de dependências entre serviços e identificação proativa de problemas. Ao final do curso, os participantes estarão preparados para aplicar práticas de SRE utilizando Dynatrace como plataforma central de observabilidade e monitoramento.

Objetivo

Após realizar este curso Dynatrace Site Reliability Engineering (SRE), você será capaz de:

Implementar práticas de confiabilidade de serviços utilizando Dynatrace
Monitorar métricas críticas de disponibilidade e performance
Detectar automaticamente incidentes operacionais
Utilizar inteligência artificial para análise de causa raiz
Monitorar aplicações distribuídas e microservices
Construir dashboards de confiabilidade de serviços
Aplicar boas práticas de observabilidade para SRE

Publico Alvo

Site Reliability Engineers (SRE)
Engenheiros DevOps
Engenheiros de plataforma
Engenheiros de observabilidade
Administradores de infraestrutura cloud
Profissionais de operações de aplicações

Pre-Requisitos

Conhecimento básico de monitoramento de sistemas
Noções de DevOps e observabilidade
Familiaridade com ambientes Linux ou cloud
Conhecimento básico de aplicações distribuídas

Materiais

Inglês/Português + Exercícios + Lab Pratico

Conteúdo Programatico

Module 1: Introduction to Site Reliability Engineering

SRE principles and reliability engineering
Monitoring and observability concepts
Dynatrace platform overview
Reliability monitoring strategies
SRE operational practices

Module 2: Dynatrace Architecture for SRE

Dynatrace platform components
OneAgent architecture
Automatic service discovery
Telemetry data collection
Observability data pipelines

Module 3: Monitoring Reliability Metrics

Availability monitoring
Latency and response time metrics
Error rate analysis
Resource saturation metrics
Reliability indicators

Module 4: Distributed Application Monitoring

Monitoring microservices architectures
Service dependency mapping
Distributed transaction tracing
End-to-end request monitoring
Performance diagnostics

Module 5: AI-Powered Incident Detection

Davis AI overview
Automatic anomaly detection
Event correlation techniques
Root cause analysis workflows
Intelligent incident detection

Module 6: Monitoring Kubernetes Environments

Monitoring containerized applications
Dynatrace integration with Kubernetes
Observability for cloud native platforms
Monitoring container workloads
Kubernetes reliability monitoring

Module 7: Reliability Dashboards and Visualization

Dynatrace dashboards overview
Creating reliability dashboards
Visualizing service health metrics
Infrastructure reliability dashboards
Visualization best practices

Module 8: Alerting and Incident Response

Alert design strategies
Intelligent alerting workflows
Incident response processes
Integrating with incident management tools
Operational monitoring practices

Module 9: Reliability Analysis and Continuous Improvement

Incident analysis using observability data
Reliability improvement cycles
Post-incident review processes
Operational performance metrics
Continuous monitoring improvement

Module 10: Operating SRE Monitoring in Production

Scaling monitoring environments
Observability governance
Security and access control
Monitoring operational best practices
Enterprise reliability strategies

32h

Ver Curso

Curso Dynatrace Site Reliability Engineering SRE

Curso Dynatrace Site Reliability Engineering SRE

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Docker Foundation

Curso Ansible Red Hat Basics Automation Technical Foundation

Curso Ansible Foundation

Curso Terraform Foundation

Curso Terraform Deploying to Oracle Cloud Infrastructure

Curso Ansible Linux Automation with Ansible

Curso Agile Product Owner

Curso Agile Fundamentals

Ansible Overview of Ansible architecture

Advanced Automation: Ansible Best Practices

O que você quer aprender hoje?

Curso Dynatrace Site Reliability Engineering SRE

Curso Dynatrace Site Reliability Engineering SRE

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Docker Foundation

Curso Ansible Red Hat Basics Automation Technical Foundation

Curso Ansible Foundation

Curso Terraform Foundation

Curso Terraform Deploying to Oracle Cloud Infrastructure

Curso Ansible Linux Automation with Ansible

Curso Agile Product Owner

Curso Agile Fundamentals

Ansible Overview of Ansible architecture

Advanced Automation: Ansible Best Practices