Visão Geral
Este Curso Kafka Ecosystem with Clustering, oferece uma visão abrangente do ecossistema Apache Kafka, focando em como configurar, gerenciar e operar clusters Kafka de forma eficiente. Os participantes aprenderão sobre todos os componentes-chave do Kafka, incluindo Kafka Connect, Kafka Streams, KSQL e como integrar com sistemas externos. Além disso, o curso aborda práticas de clustering, replicação, tolerância a falhas e alta disponibilidade, essenciais para soluções corporativas de streaming de dados.
Objetivo
Após realizar este curso Kafka Ecosystem with Clustering, você será capaz de:
- Compreender o ecossistema Kafka e seus principais componentes.
- Configurar e gerenciar clusters Kafka altamente disponíveis e escaláveis.
- Garantir tolerância a falhas, replicação e persistência de dados.
- Integrar Kafka com sistemas externos usando Kafka Connect e Kafka Streams.
- Monitorar e otimizar o desempenho de clusters Kafka.
Publico Alvo
- Engenheiros de dados e arquitetos de soluções.
- Desenvolvedores de software que trabalham com aplicações em tempo real.
- Profissionais de DevOps e SRE responsáveis por manter clusters Kafka.
- Analistas e cientistas de dados que lidam com ingestão de dados em tempo real.
Pre-Requisitos
- Conhecimento básico de programação Java ou Python.
- Noções de bancos de dados e SQL.
- Compreensão básica de sistemas distribuídos.
- Noções básicas de mensageria e eventos são desejáveis.
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico
Módulo 1 – Introdução ao Ecossistema Kafka
- Visão geral do Apache Kafka e arquitetura distribuída.
- Componentes do ecossistema: Kafka Brokers, Zookeeper, Kafka Connect, Kafka Streams, KSQL.
- Casos de uso em streaming de dados e eventos em tempo real.
Módulo 2 – Configuração de Kafka e Cluster Básico
- Instalação e configuração de brokers Kafka.
- Criação de tópicos e configuração de partições e replicação.
- Configuração de clusters multi-broker.
- Papel do Zookeeper e introdução ao Kafka Raft Metadata Mode.
Módulo 3 – Produtores e Consumidores
- Configuração de produtores e consumidores Kafka.
- Garantias de entrega: at-most-once, at-least-once, exactly-once.
- Estratégias de particionamento e balanceamento de carga.
- Grupos de consumidores e commit de offsets.
Módulo 4 – Kafka Streams e Processamento de Fluxos
- Introdução ao Kafka Streams API.
- Transformações de dados: map, filter, join, aggregate.
- Windows e processamento temporal.
- Garantias de consistência e idempotência.
Módulo 5 – Kafka Connect e Integração com Sistemas Externos
- Configuração de Source e Sink Connectors.
- Integração com bancos de dados, filas de mensagens e sistemas externos.
- Serialização e deserialização de dados: JSON, Avro, Protobuf.
- Monitoramento de Connectors e tratamento de falhas.
Módulo 6 – Clustering Avançado e Alta Disponibilidade
- Replicação de tópicos e estratégias de failover.
- Partition leadership e balanceamento de carga.
- Estratégias de retenção de dados e compactação de logs.
- Atualizações e manutenção de clusters em produção.
Módulo 7 – Operação, Monitoramento e Troubleshooting
- Métricas de desempenho: throughput, lag, latência.
- Monitoramento de brokers, consumidores e produtores.
- Troubleshooting de erros comuns e práticas de recuperação.
- Escalabilidade e otimização de clusters.
Módulo 8 – Projeto Prático
- Implementação de um cluster Kafka funcional.
- Ingestão de dados em tempo real e processamento com Kafka Streams.
- Integração com sistemas externos usando Connectors.
- Testes, monitoramento e otimização do cluster.
TENHO INTERESSE