Curso Apache Kafka Connect Integração e ETL

  • DevOps | CI | CD | Kubernetes | Web3

Curso Apache Kafka Connect Integração e ETL

24 horas
Visão Geral

Este Curso Apache Kafka Connect Integração e ETL, oferece uma compreensão completa do Apache Kafka Connect, uma ferramenta poderosa para integrar Kafka com sistemas externos e realizar processos de ETL. Os participantes aprenderão a configurar e gerenciar conectores, trabalhar com fontes e destinos de dados, e aplicar transformações em tempo real.

Objetivo

Após realizar este Curso Apache Kafka Connect Integração e ETL, você será capaz de:

  • Configurar e gerenciar o Apache Kafka Connect para integração de dados.
  • Trabalhar com conectores de origem e destino para diversos sistemas.
  • Realizar transformações de dados em tempo real utilizando Kafka Connect.
  • Implementar soluções de ETL com Kafka Connect de forma eficiente e escalável.
  • Monitorar e gerenciar a saúde e o desempenho dos conectores.
Publico Alvo
  • Engenheiros de dados e desenvolvedores que utilizam o Apache Kafka
  • Profissionais de integração de sistemas e arquitetura de dados
  • Administradores de sistemas e arquitetos de soluções que desejam aprender sobre ETL com Kafka
Pre-Requisitos
  • Conhecimento básico do Apache Kafka e seu funcionamento
  • Familiaridade com conceitos de integração de dados e ETL
  • Experiência com a linha de comando e operações básicas do Kafka
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

1. Introdução ao Apache Kafka Connect

  1. O que é Apache Kafka Connect e suas principais funcionalidades
  2. Arquitetura do Kafka Connect: Workers, Connectors e Tasks
  3. Casos de uso comuns para Kafka Connect em ETL e integração de sistemas

2. Configuração do Ambiente de Trabalho

  1. Instalação do Apache Kafka e Kafka Connect
  2. Configuração do ambiente de desenvolvimento e dependências necessárias
  3. Compreendendo o formato de configuração do Kafka Connect (JSON e propriedades)

3. Conectores de Origem (Source Connectors)

  1. O que são conectores de origem e como funcionam
  2. Configuração de conectores de origem para bancos de dados (JDBC, Debezium)
  3. Extração de dados de sistemas de arquivos e APIs REST
  4. Gerenciamento de offsets e controle de dados duplicados

4. Conectores de Destino (Sink Connectors)

  1. O que são conectores de destino e suas aplicações
  2. Configuração de conectores de destino para armazenamento em bancos de dados (JDBC)
  3. Envio de dados para sistemas de arquivos, sistemas de mensagens e data lakes
  4. Garantia de entrega e gerenciamento de falhas em conectores de destino

5. Transformações de Dados em Tempo Real

  1. Introdução ao Single Message Transformations (SMT)
  2. Aplicando transformações simples: renomeação de campos, filtragem e mapeamento
  3. Criação de transformações customizadas para requisitos específicos
  4. Combinando várias transformações em um único pipeline

6. Gerenciamento e Monitoramento de Conectores

  1. Monitoramento do estado dos conectores e tarefas
  2. Visualizando métricas e logs do Kafka Connect
  3. Técnicas de troubleshooting e resolução de problemas comuns
  4. Melhores práticas para manter a saúde do Kafka Connect

7. Implementação de Soluções de ETL

  1. Planejamento e design de pipelines de ETL com Kafka Connect
  2. Casos de uso práticos para integração de dados em tempo real
  3. Estratégias para escalar soluções de ETL com Kafka Connect
  4. Testes e validação de soluções de ETL

8. Integração com Outras Ferramentas do Ecossistema Kafka

  1. Integração do Kafka Connect com Kafka Streams para processamento de dados
  2. Uso de Kafka Connect com ferramentas de visualização e BI
  3. Como integrar Kafka Connect com outras soluções de ETL e ferramentas de dados

9. Estudo de Caso e Projetos Práticos

  1. Análise de casos de uso reais utilizando Kafka Connect
  2. Desenvolvimento de um projeto prático: construção de um pipeline de ETL completo
  3. Discussão sobre desafios enfrentados e soluções adotadas em projetos reais

10. Conclusão e Futuro do Kafka Connect

  1. Resumo das melhores práticas discutidas durante o curso
  2. Tendências futuras e inovações no Apache Kafka Connect
  3. Recursos adicionais para aprendizado contínuo e desenvolvimento de habilidades
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h