Visão Geral
Este Curso Kafka Streaming Data Architecture, fornece uma compreensão prática e teórica sobre a arquitetura de dados em streaming usando Apache Kafka. Os participantes aprenderão como projetar, implementar e gerenciar pipelines de dados em tempo real, utilizando Kafka como núcleo para integração de sistemas distribuídos, processamento de eventos e análise de dados em tempo real. O curso combina teoria com exercícios práticos para garantir que os alunos possam aplicar os conceitos diretamente em projetos reais.
Conteúdo Programatico
Módulo 1 – Introdução ao Streaming de Dados e Kafka
- Conceitos de dados em streaming vs batch.
- Casos de uso de streaming de dados.
- Arquitetura do Apache Kafka: brokers, tópicos, partições, offsets.
- Conceito de logs imutáveis e armazenamento distribuído.
Módulo 2 – Kafka Core: Produtores, Consumidores e Tópicos
- Criação e configuração de tópicos Kafka.
- Produtores: envio de mensagens e garantias de entrega.
- Consumidores: leitura de mensagens, grupos de consumidores e commit de offsets.
- Estratégias de particionamento e balanceamento de carga.
Módulo 3 – Kafka Streams e Processamento de Dados em Tempo Real
- Introdução ao Kafka Streams API.
- Transformações de dados em fluxo (map, filter, join, aggregate).
- Windowing e eventos temporais.
- Garantias de processamento: at-least-once e exactly-once.
Módulo 4 – Integração Kafka com Sistemas Externos
- Kafka Connect: Source e Sink Connectors.
- Integração com bancos de dados, sistemas de mensageria e aplicações externas.
- Serialização e deserialização de dados (JSON, Avro, Protobuf).
Módulo 5 – Arquitetura Avançada de Kafka
- Replicação, tolerância a falhas e alta disponibilidade.
- Estratégias de retenção e compactação de logs.
- Design de pipelines de dados distribuídos.
- Integração com sistemas de monitoramento e alertas.
Módulo 6 – Operação e Monitoramento de Clusters Kafka
- Configuração de brokers, zookeepers e clusters Kafka.
- Métricas e monitoramento (CPU, memória, throughput, lag de consumidor).
- Troubleshooting e resolução de problemas comuns.
- Otimização de desempenho e escalabilidade.
Módulo 7 – Projeto Prático
- Implementação de um pipeline completo de streaming de dados.
- Ingestão de dados, processamento com Kafka Streams e saída para sistemas externos.
- Testes, monitoramento e ajustes de performance.