Visão Geral
Este Curso RabbitMQ Sustentação e Operação em Ambientes de Produção foi projetado para capacitar profissionais técnicos e operacionais a realizar a sustentação, administração e monitoramento de ambientes que utilizam RabbitMQ em produção. Com abordagem prática e voltada para problemas reais, o curso cobre tópicos como: instalação, configuração, troubleshooting, HA (Alta Disponibilidade), tuning, upgrades e práticas de observabilidade. Os alunos serão expostos a cenários de produção simulados, com ênfase na identificação de falhas, recuperação de serviços, boas práticas operacionais, e garantia de performance e disponibilidade.
O Curso RabbitMQ Sustentação e Operação em Ambientes de Produção aprofunda-se nos aspectos técnicos e operacionais de sustentação de ambientes RabbitMQ, incluindo:
- Análise de logs, alarmes, métricas e eventos
- Simulação de incidentes reais e troubleshooting guiado
- Automação de rotinas administrativas
- Gerenciamento de ciclo de vida de filas e consumidores
- Segurança operacional com TLS e controle granular de permissões
- Alta disponibilidade via clustering e replicação
- Implementação de práticas de observabilidade com Prometheus e Grafana
- Técnicas de upgrade seguro, rollback e hotfix
Por que fazer este curso?
O RabbitMQ é uma das plataformas de mensageria mais utilizadas globalmente em ambientes distribuídos, microserviços e sistemas que demandam escalabilidade e resiliência. Embora sua instalação seja relativamente simples, a manutenção de ambientes estáveis, seguros e performáticos exige conhecimento técnico aprofundado e visão operacional.
Este curso foi desenhado exatamente para capacitar profissionais e equipes que atuam na linha de frente da sustentação, garantindo que o RabbitMQ esteja disponível, monitorado, seguro e pronto para crescer com a demanda.
Benefícios para as empresas que investem nessa qualificação
✅ Redução de Incidentes e Ganho em Estabilidade
- Profissionais capacitados reduzem drasticamente o tempo de inatividade.
- A equipe aprende a aplicar práticas proativas de monitoramento e prevenção de falhas.
✅ Melhoria da Performance e Eficiência Operacional
- Otimização de filas, tuning de consumo, uso eficiente de memória e disco.
- Maior throughput e menor latência em aplicações que dependem do RabbitMQ.
✅ Resiliência e Alta Disponibilidade Garantidas
- Adoção correta de estratégias de HA com quorum queues ou clusters replicados.
- Recuperação rápida de nós e sistemas sem perda de mensagens ou indisponibilidade.
✅ Padronização e Governança Técnica
- Práticas consistentes na gestão de configurações, permissões, upgrades e deploys.
- Alinhamento com princípios de DevOps, SRE e segurança da informação.
✅ Apoio a Projetos de Transformação Digital
- Sustentação eficiente de integrações assíncronas e microserviços.
- Aumento da confiança da organização em seus sistemas de mensageria crítica.
Conteúdo Programatico
Módulo 1 – Introdução à Arquitetura do RabbitMQ
- O que é RabbitMQ e seu papel em arquiteturas distribuídas
- Protocolos: AMQP 0.9.1, MQTT e STOMP
- Conceitos principais: Exchanges, Queues, Bindings, VHosts
- Componentes de uma instância e de um cluster
Módulo 2 – Instalação e Configuração Inicial
- Instalação em Linux (Debian/Ubuntu/CentOS)
- Configuração básica (
rabbitmq.conf
, enabled_plugins
)
- Criação de usuários e permissões
- Introdução à CLI (
rabbitmqctl
, rabbitmq-diagnostics
)
Módulo 3 – Alta Disponibilidade e Clustering
- Montando um cluster RabbitMQ
- Tipos de mirroring (classic mirrors x quorum queues)
- Estratégias de replicação e sincronização
- Tolerância a falhas e nós com comportamento inesperado
Módulo 4 – Monitoramento e Observabilidade
- Logs e arquivos de diagnóstico
- Health checks e alarmes do RabbitMQ
- Integrando com Prometheus e Grafana
- Uso do Management Plugin e relatórios de status
Módulo 5 – Troubleshooting e Recuperação
- Troubleshooting de filas não processadas
- Detectando mensagens zumbis ou stuck
- Como identificar back-pressure e overload
- Recuperação de nós corrompidos ou desconectados
- Estratégias de failover e reinício controlado
Módulo 6 – Manutenção e Operações Seguras
- Atualizações seguras (rolling upgrades)
- Backup e restore de configurações e mensagens
- Controle de crescimento de filas e retenção
- Limpeza de mensagens e filas antigas
Módulo 7 – Performance e Escalabilidade
- Tuning de performance e consumo
- Estratégias para balanceamento de carga
- Otimização de uso de memória, disco e rede
- Estratégias de escalonamento horizontal
Módulo 8 – Segurança e Boas Práticas Operacionais
- Autenticação e autorização de usuários
- Criptografia de dados em trânsito (TLS)
- Isolamento de ambientes via vhosts
- Práticas recomendadas para ambientes críticos
Módulo 9 – Automação e Infraestrutura como Código
- Instalação via Docker e Docker Compose
- Uso de Ansible para provisionamento
- Scripts úteis para monitoramento e análise
- CI/CD para configuração de ambientes RabbitMQ
Módulo 10 – Laboratórios Avançados e Casos Reais
- Diagnóstico e resolução de falhas simuladas
- Reconfiguração de cluster com nó problemático
- Simulação de upgrade com alta disponibilidade
- Criação de painel de métricas com Grafana