Curso RabbitMQ Sustentacao e Operacao em Ambientes de Producao
24 horasVisão Geral
Este Curso RabbitMQ Sustentação e Operação em Ambientes de Produção foi projetado para capacitar profissionais técnicos e operacionais a realizar a sustentação, administração e monitoramento de ambientes que utilizam RabbitMQ em produção. Com abordagem prática e voltada para problemas reais, o curso cobre tópicos como: instalação, configuração, troubleshooting, HA (Alta Disponibilidade), tuning, upgrades e práticas de observabilidade. Os alunos serão expostos a cenários de produção simulados, com ênfase na identificação de falhas, recuperação de serviços, boas práticas operacionais, e garantia de performance e disponibilidade.
O Curso RabbitMQ Sustentação e Operação em Ambientes de Produção aprofunda-se nos aspectos técnicos e operacionais de sustentação de ambientes RabbitMQ, incluindo:
- Análise de logs, alarmes, métricas e eventos
- Simulação de incidentes reais e troubleshooting guiado
- Automação de rotinas administrativas
- Gerenciamento de ciclo de vida de filas e consumidores
- Segurança operacional com TLS e controle granular de permissões
- Alta disponibilidade via clustering e replicação
- Implementação de práticas de observabilidade com Prometheus e Grafana
- Técnicas de upgrade seguro, rollback e hotfix
Por que fazer este curso?
O RabbitMQ é uma das plataformas de mensageria mais utilizadas globalmente em ambientes distribuídos, microserviços e sistemas que demandam escalabilidade e resiliência. Embora sua instalação seja relativamente simples, a manutenção de ambientes estáveis, seguros e performáticos exige conhecimento técnico aprofundado e visão operacional.
Este curso foi desenhado exatamente para capacitar profissionais e equipes que atuam na linha de frente da sustentação, garantindo que o RabbitMQ esteja disponível, monitorado, seguro e pronto para crescer com a demanda.
Benefícios para as empresas que investem nessa qualificação
✅ Redução de Incidentes e Ganho em Estabilidade
- Profissionais capacitados reduzem drasticamente o tempo de inatividade.
- A equipe aprende a aplicar práticas proativas de monitoramento e prevenção de falhas.
✅ Melhoria da Performance e Eficiência Operacional
- Otimização de filas, tuning de consumo, uso eficiente de memória e disco.
- Maior throughput e menor latência em aplicações que dependem do RabbitMQ.
✅ Resiliência e Alta Disponibilidade Garantidas
- Adoção correta de estratégias de HA com quorum queues ou clusters replicados.
- Recuperação rápida de nós e sistemas sem perda de mensagens ou indisponibilidade.
✅ Padronização e Governança Técnica
- Práticas consistentes na gestão de configurações, permissões, upgrades e deploys.
- Alinhamento com princípios de DevOps, SRE e segurança da informação.
✅ Apoio a Projetos de Transformação Digital
- Sustentação eficiente de integrações assíncronas e microserviços.
- Aumento da confiança da organização em seus sistemas de mensageria crítica.
Objetivo
Após realizar este Curso RabbitMQ Sustentação e Operação em Ambientes de Produção, você será capaz de:
- Instalar, configurar e manter ambientes RabbitMQ com foco em disponibilidade e estabilidade
- Diagnosticar e resolver falhas em clusters RabbitMQ
- Monitorar performance e métricas críticas
- Realizar tuning e otimizações de acordo com o uso
- Efetuar upgrades com segurança
- Aplicar boas práticas para ambientes produtivos
Publico Alvo
- Suporte técnico de nível 2 e 3
- Administradores de sistemas e infraestrutura
- Engenheiros de confiabilidade (SRE)
- Product Owners técnicos de plataformas
- Operadores de TI
- Equipes de DevOps e Plataforma
- Profissionais responsáveis pela sustentação de filas e mensageria
Pre-Requisitos
- Ter realizado o Curso RabbitMQ Foundation
- Conhecimentos básicos em Linux e redes
- Familiaridade com mensageria e filas (desejável)
- Noções de containers e Docker (desejável)
- Experiência prévia com administração de sistemas é um diferencial
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Módulo 1 – Introdução à Arquitetura do RabbitMQ
- O que é RabbitMQ e seu papel em arquiteturas distribuídas
- Protocolos: AMQP 0.9.1, MQTT e STOMP
- Conceitos principais: Exchanges, Queues, Bindings, VHosts
- Componentes de uma instância e de um cluster
Módulo 2 – Instalação e Configuração Inicial
- Instalação em Linux (Debian/Ubuntu/CentOS)
- Configuração básica (
rabbitmq.conf
,enabled_plugins
) - Criação de usuários e permissões
- Introdução à CLI (
rabbitmqctl
,rabbitmq-diagnostics
)
Módulo 3 – Alta Disponibilidade e Clustering
- Montando um cluster RabbitMQ
- Tipos de mirroring (classic mirrors x quorum queues)
- Estratégias de replicação e sincronização
- Tolerância a falhas e nós com comportamento inesperado
Módulo 4 – Monitoramento e Observabilidade
- Logs e arquivos de diagnóstico
- Health checks e alarmes do RabbitMQ
- Integrando com Prometheus e Grafana
- Uso do Management Plugin e relatórios de status
Módulo 5 – Troubleshooting e Recuperação
- Troubleshooting de filas não processadas
- Detectando mensagens zumbis ou stuck
- Como identificar back-pressure e overload
- Recuperação de nós corrompidos ou desconectados
- Estratégias de failover e reinício controlado
Módulo 6 – Manutenção e Operações Seguras
- Atualizações seguras (rolling upgrades)
- Backup e restore de configurações e mensagens
- Controle de crescimento de filas e retenção
- Limpeza de mensagens e filas antigas
Módulo 7 – Performance e Escalabilidade
- Tuning de performance e consumo
- Estratégias para balanceamento de carga
- Otimização de uso de memória, disco e rede
- Estratégias de escalonamento horizontal
Módulo 8 – Segurança e Boas Práticas Operacionais
- Autenticação e autorização de usuários
- Criptografia de dados em trânsito (TLS)
- Isolamento de ambientes via vhosts
- Práticas recomendadas para ambientes críticos
Módulo 9 – Automação e Infraestrutura como Código
- Instalação via Docker e Docker Compose
- Uso de Ansible para provisionamento
- Scripts úteis para monitoramento e análise
- CI/CD para configuração de ambientes RabbitMQ
Módulo 10 – Laboratórios Avançados e Casos Reais
- Diagnóstico e resolução de falhas simuladas
- Reconfiguração de cluster com nó problemático
- Simulação de upgrade com alta disponibilidade
- Criação de painel de métricas com Grafana