Curso ETL com Pentaho Data Integration PDI

  • Tableau Data Visualization

Curso ETL com Pentaho Data Integration PDI

40 horas
Visão Geral

Este Curso ETL com Pentaho Data Integration PDI introdutório é voltado para desenvolvedores que desejam aprender a criar processos de Extração, Transformação e Carga (ETL) utilizando o Pentaho Data Integration (PDI), também conhecido como Kettle. O Curso ETL com Pentaho Data Integration PDI explora os fundamentos da ferramenta, desde a configuração inicial até a construção de pipelines básicos, com foco em exemplos práticos e cenários reais.

Por que você deve fazer este curso

  • Os processos de ETL são a base para integração e preparação de dados em projetos de business intelligence e análise. Este curso oferece uma introdução acessível ao Pentaho Data Integration, uma ferramenta open-source poderosa e amplamente utilizada, capacitando você a transformar dados brutos em informações úteis e a dar os primeiros passos em engenharia de dados.

 

Objetivo

Após realizar este Curso ETL com Pentaho Data Integration PDI, você será capaz de:

  • Instalar e configurar o Pentaho Data Integration em seu ambiente.
  • Criar transformações básicas para extrair, transformar e carregar dados.
  • Conectar-se a fontes de dados como arquivos e bancos relacionais.
  • Aplicar operações simples de limpeza e agregação de dados.
  • Executar e automatizar pipelines de ETL com jobs.
Publico Alvo
  • Desenvolvedores iniciantes interessados em processos de ETL.
  • Analistas de dados ou profissionais de TI que desejam aprender uma ferramenta de integração de dados.
  • Estudantes ou recém-formados em tecnologia buscando habilidades práticas em BI.
Pre-Requisitos
  • Conhecimento básico de lógica de programação (não é necessário nível avançado).
  • Familiaridade com conceitos de bancos de dados (ex.: tabelas, consultas SQL simples).
  • Não é necessária experiência prévia com Pentaho ou ETL.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Introduction to ETL and PDI

  1. What is ETL? Key concepts and applications
  2. Overview of Pentaho Data Integration (PDI)
  3. Installing PDI and exploring the Spoon interface
  4. Hands-on: Setting up your first PDI environment

Understanding Transformations

  1. Basics of transformations: Steps and hops
  2. Creating a simple transformation workflow
  3. Practical example: Loading a CSV file into PDI

Extracting Data from Files

  1. Working with CSV, Excel, and text inputs
  2. Configuring input steps and previewing data
  3. Hands-on: Extracting data from a sample Excel file

Connecting to Databases

  1. Setting up database connections (JDBC)
  2. Extracting data with the Table Input step
  3. Practical example: Loading data from a MySQL table

Basic Data Transformations

  1. Using steps: Filter Rows, Select Values, Replace in String
  2. Cleaning data: Removing nulls and duplicates
  3. Hands-on: Transforming raw sales data

Loading Data into Destinations

  1. Writing to files (CSV, Text Output)
  2. Loading data into databases (Table Output)
  3. Practical example: Exporting transformed data to a database

Introduction to Jobs

  1. Differences between transformations and jobs
  2. Creating a job to orchestrate transformations
  3. Hands-on: Building a job to run multiple steps

Simple Aggregations and Joins

  1. Aggregating data with Group By
  2. Joining datasets with Merge Join
  3. Practical example: Summarizing sales by region

Error Handling and Logging

  1. Adding basic error handling in transformations
  2. Configuring logs for debugging
  3. Hands-on: Setting up error logging for a pipeline

Final Project and Review

  1. Designing a complete ETL process from scratch
  2. Combining extraction, transformation, and loading
  3. Final exercise: Creating a pipeline for a sample dataset
TENHO INTERESSE

Cursos Relacionados

Curso Análise de Dados Com o Power BI - 20778B

24 horas

Curso Análise de dados Excel Com Power BI - 20779B

16 horas

Curso Talend Data Integration Foundation

16 horas

Curso Talend Data Integration Advanced

16 horas

Curso Advanced Data Analysis and Dashboard Reporting

28 horas