Curso Arquitetura Database Greenplum

  • Database

Curso Arquitetura Database Greenplum

32 horas
Visão Geral

O curso Arquitetura Database Greenplum oferece uma imersão técnica completa no funcionamento interno e no uso avançado do banco de dados Greenplum, um sistema de gerenciamento de banco de dados analítico massivamente paralelo (MPP) baseado em PostgreSQL, projetado para processar grandes volumes de dados de forma distribuída e escalável.

Ao longo do curso, os participantes terão contato direto com os componentes fundamentais da arquitetura Greenplum, incluindo o mecanismo de distribuição de dados baseado em hash, segmentação, execução paralela de queries, particionamento físico e design de tabelas columnar e heap. O conteúdo também abrange tópicos avançados como modelagem física, desnormalização para performance, tuning de queries analíticas, funções OLAP, operadores de conjuntos e manutenção com ANALYZE e VACUUM.

Além disso, o curso cobre detalhadamente os aspectos da linguagem SQL aplicados ao Greenplum, com ênfase em agregações distribuídas, estratégias de join eficientes, funções estatísticas e operações de transformação de dados. Os alunos aprendem a projetar arquiteturas de banco eficientes para cargas analíticas em larga escala, com ênfase em performance, paralelismo e balanceamento de carga.

Durante a formação, será construído um ambiente de dados realista para execução de um projeto prático, no qual os participantes aplicarão as melhores práticas de modelagem e execução de queries distribuídas, permitindo não apenas o entendimento conceitual, mas também a capacitação técnica para atuar em ambientes produtivos de dados em cluster.

Este curso é essencial para profissionais que desejam dominar os aspectos arquitetônicos, operacionais e práticos do Greenplum para soluções de Data Warehousing, Data Lakehouse e plataformas analíticas modernas em larga escala.

Objetivo

Após realizar este curso Arquitetura Database Greenplum, você será capaz de:

  • Compreender profundamente a arquitetura distribuída do Greenplum
  • Projetar e otimizar estruturas de tabelas em ambientes massivamente paralelos
  • Trabalhar com técnicas de distribuição, hashing e modelagem física
  • Escrever SQL eficiente para ambientes analíticos com grandes volumes de dados
  • Usar funções analíticas e estatísticas para exploração de dados
  • Aplicar estratégias de manutenção e análise de desempenho no Greenplum
Publico Alvo
  • Administradores de banco de dados (DBAs)
  • Engenheiros e arquitetos de dados
  • Cientistas de dados e analistas de BI
  • Desenvolvedores SQL e engenheiros de software
  • Profissionais de Big Data que usam bancos MPP
Pre-Requisitos
  • Conhecimentos básicos de banco de dados relacional
  • Familiaridade com linguagem SQL
  • Noções de modelagem de dados
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Módulo 1 – Introduction to the Greenplum Architecture

  1. Visão geral do Greenplum Database
  2. Arquitetura MPP (Massively Parallel Processing)
  3. Master e Segment Instances
  4. Interação com o Query Planner e Executor

Módulo 2 – Greenplum Table Structures

  1. Tipos de tabelas no Greenplum: Heap, Append-Only, Columnar
  2. Criação e gerenciamento de tabelas
  3. Considerações de desempenho e uso

Módulo 3 – Hashing and Data Distribution

  1. Estratégias de distribuição de dados
  2. Distribuição por HASH e RANDOM
  3. Impacto no desempenho de joins e agregações

Módulo 4 – The Technical Details

  1. Sistema de arquivos e armazenamento
  2. Interações com o planner
  3. Internals do GPDB e logs

Módulo 5 – Physical Database Design

  1. Modelagem física no Greenplum
  2. Estratégias de particionamento e segmentação
  3. Armazenamento em disco e impacto na performance

Módulo 6 – Denormalization

  1. Quando desnormalizar no Greenplum
  2. Modelagem dimensional e schema flat
  3. Trade-offs entre normalização e desempenho

Módulo 7 – Nexus for Greenplum

  1. Integração com Nexus (caso aplicável)
  2. Visualização de execução de queries
  3. Ferramentas de tuning via Nexus

Módulo 8 – The Basics of SQL

  1. Revisão das principais cláusulas SQL
  2. Sintaxe SELECT, INSERT, UPDATE, DELETE
  3. Ordenação e paginação de resultados

Módulo 9 – The WHERE Clause

  1. Uso correto da cláusula WHERE
  2. Filtros condicionais e operadores lógicos
  3. Indexação e filtragem eficiente

Módulo 10 – Distinct vs. Group By

  1. Diferenças entre DISTINCT e GROUP BY
  2. Casos de uso e impacto na performance
  3. Exemplo prático em ambientes MPP

Módulo 11 – Aggregation

  1. Funções de agregação básicas (SUM, COUNT, AVG, etc.)
  2. Agrupamentos por múltiplas colunas
  3. Agregações com HAVING e filtros

Módulo 12 – Join Functions

  1. Tipos de JOINs suportados
  2. Estratégias de execução em joins distribuídos
  3. Hash Join vs Merge Join no Greenplum

Módulo 13 – Conversions and Formatting

  1. Conversão de tipos de dados (CAST, ::)
  2. Formatação de strings, datas e números
  3. Boas práticas e tratamento de erros

Módulo 14 – OLAP Functions

  1. Funções analíticas (OVER, RANK, NTILE, LAG, LEAD)
  2. Partições e ordenações em funções OLAP
  3. Casos de uso em relatórios e análise

Módulo 15 – Substrings and Positioning Functions

  1. Manipulação de strings com funções nativas
  2. SUBSTRING, POSITION, LENGTH, REPLACE, REGEXP
  3. Eficiência em consultas de texto

Módulo 16 – Set Operators Functions

  1. UNION, INTERSECT, EXCEPT
  2. Regras de compatibilidade entre conjuntos
  3. Casos práticos com grandes volumes

Módulo 17 – Table Create and Data Types

  1. Comando CREATE TABLE em detalhes
  2. Tipos de dados suportados e suas peculiaridades
  3. Restrições, chaves e constraints

Módulo 18 – ANALYZE and VACUUM

  1. Importância da coleta de estatísticas
  2. Quando e como usar ANALYZE
  3. Limpeza e manutenção com VACUUM FULL vs VACUUM FREEZE

Módulo 19 – Statistical Aggregate Functions

  1. STDDEV, VARIANCE, COVAR, CORR
  2. Aplicações estatísticas no Greenplum
  3. Exemplo com análise exploratória de dados

Módulo 20 – Projeto Prático Final

  1. Desafio com modelagem, carga e análise
  2. Criação de estruturas otimizadas
  3. Execução e análise de queries complexas
  4. Apresentação de resultados e tuning
TENHO INTERESSE

Cursos Relacionados

Curso Oracle Database 12c Admin Install Upgrade

32 horas

Curso Oracle Database 12c Administração I

32 horas

Curso Oracle 12c Banco de Dados Introdução ao SQL

28 Horas

Curso Oracle Fundamentos de Big Data

32 horas

Curso Oracle Database 12c Performance Tuning

24 Horas

Curso Oracle 12c 10 Programa com PL/SQL

32 horas

Curso Oclacle 12c RAC – Administração de Banco de Dados

32 horas

Curso Oracle 12c Banco de Dados PL/SQL Advanced

24 horas

Curso Oracle 18c Database Backup and Recovery Workshop

32 horas