Curso ETL com Pentaho Data Integration PDI Advanced

  • Tableau Data Visualization

Curso ETL com Pentaho Data Integration PDI Advanced

40 horas
Visão Geral

Curso ETL com Pentaho Data Integration PDI Advanced: Desenvolvimento de Processos de ETL com Pentaho Data Integration (PDI) Este Curso ETL com Pentaho Data Integration PDI Advanced é voltado para desenvolvedores com experiência básica em Pentaho Data Integration (PDI) que desejam aprofundar suas habilidades no desenvolvimento de processos de ETL complexos e otimizados. O treinamento cobre tópicos como integração com big data, personalização de transformações, automação avançada e desempenho, com foco em cenários práticos e soluções corporativas.

Por que você deve fazer este curso

  • O domínio de técnicas avançadas de ETL com o PDI permite que você enfrente desafios de integração de dados em larga escala, otimize pipelines e crie soluções personalizadas para atender às necessidades de negócios complexas. Este curso eleva suas competências, preparando-o para projetos críticos em engenharia de dados e big data.
Objetivo

Após realizar este Curso ETL com Pentaho Data Integration PDI Advanced: Desenvolvimento de Processos de ETL com Pentaho Data Integration (PDI), você será capaz de:

  • Desenvolver pipelines de ETL complexos e escaláveis com o PDI.
  • Integrar o PDI com sistemas de big data e fluxos em tempo real.
  • Criar transformações personalizadas usando scripts e plugins.
  • Otimizar o desempenho de processos ETL em larga escala.
  • Automatizar e monitorar fluxos de trabalho avançados com alta confiabilidade.
Publico Alvo
  • Desenvolvedores com experiência prévia em ETL e PDI (nível básico ou intermediário).
  • Engenheiros de dados buscando otimizar processos de integração.
  • Profissionais de BI ou TI que trabalham com pipelines de dados avançados.
Pre-Requisitos
  • Conhecimento básico de Pentaho Data Integration (ex.: criação de transformações e jobs).
  • Familiaridade com SQL e manipulação de bancos de dados relacionais.
  • Experiência com lógica de programação (ex.: Java, Python ou scripting) é um diferencial.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Advanced PDI Concepts and Architecture

  1. Deep dive into PDI execution engine and parallelism
  2. Configuring PDI for high-performance environments
  3. Hands-on: Setting up a multi-threaded transformation

Complex Data Extraction

  1. Extracting from REST APIs and web services
  2. Handling unstructured and semi-structured data (JSON, XML)
  3. Practical example: Loading data from a REST API

Advanced Transformations and Joins

  1. Dynamic transformations with variables and parameters
  2. Multi-table joins and slowly changing dimensions (SCD)
  3. Hands-on: Implementing an SCD Type 2 process

Custom Steps and Scripting

  1. Developing custom steps with Java
  2. Using JavaScript and Python scripting in PDI
  3. Practical example: Creating a custom data enrichment step

Big Data Integration

  1. Connecting PDI to Hadoop (HDFS, Hive)
  2. Processing real-time streams with Kafka
  3. Hands-on: Building a Kafka-to-database pipeline

Performance Optimization

  1. Identifying bottlenecks and optimizing transformations
  2. Using partitioning and clustering for scalability
  3. Practical example: Tuning a high-volume ETL job

Advanced Job Orchestration

  1. Designing workflows with sub-jobs and loops
  2. Implementing retry logic and error recovery
  3. Hands-on: Automating a multi-stage ETL process

Security and Data Governance

  1. Securing transformations and connections (encryption)
  2. Implementing audit trails and data lineage
  3. Practical example: Adding encryption to a pipeline

Monitoring and Troubleshooting

  1. Advanced logging and metrics configuration
  2. Debugging complex ETL workflows
  3. Hands-on: Setting up real-time monitoring

Final Project: End-to-End Advanced ETL

  1. Designing a complete ETL solution with big data integration
  2. Optimizing and automating the pipeline
  3. Final exercise: Deploying a scalable ETL process
TENHO INTERESSE

Cursos Relacionados

Curso Análise de Dados Com o Power BI - 20778B

24 horas

Curso Análise de dados Excel Com Power BI - 20779B

16 horas

Curso Talend Data Integration Foundation

16 horas

Curso Talend Data Integration Advanced

16 horas

Curso Advanced Data Analysis and Dashboard Reporting

28 horas