Curso Big Data Greenplum DBA
40 horas Curso PraticoVisão Geral
O curso Big Data Greenplum DBA foi desenvolvido para capacitar profissionais na administração do banco de dados Greenplum, uma poderosa plataforma de dados em larga escala baseada em PostgreSQL, projetada para processamento paralelo massivo (MPP) e análise de grandes volumes de dados. Durante o treinamento, os participantes aprenderão desde os fundamentos da arquitetura MPP até a instalação, configuração, manutenção e otimização do ambiente Greenplum, além de práticas essenciais de segurança, backup, restore e troubleshooting.
Objetivo
Após realizar este curso Big Data Greenplum DBA, você será capaz de:
- Compreender a arquitetura MPP do Greenplum e sua integração com PostgreSQL.
- Instalar, configurar e administrar um cluster Greenplum.
- Monitorar e otimizar o desempenho da plataforma.
- Implementar práticas de segurança e gerenciamento de usuários.
- Realizar tarefas de backup e restore em ambientes de big data.
- Diagnosticar e solucionar problemas comuns em ambientes Greenplum.
Publico Alvo
- Administradores de banco de dados
- Engenheiros de dados
- Arquitetos de soluções analíticas
- Profissionais de infraestrutura e operações de dados
Pre-Requisitos
- Conhecimentos básicos em administração de bancos de dados
- Experiência com PostgreSQL é recomendada
- Noções de sistemas Linux e rede
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Módulo 1 – Introdução ao Greenplum
- Visão geral do Greenplum Database
- Conceitos de processamento paralelo massivo (MPP)
- Casos de uso em Big Data Analytics
- Comparação Greenplum vs PostgreSQL
Módulo 2 – Arquitetura do Greenplum
- Segmentos, Master e Standby
- Interconnect e distribuição de dados
- Espelhamento e failover
- Gerenciamento de nós
Módulo 3 – Instalação e Configuração
- Requisitos do sistema
- Instalação do Greenplum Database
- Configuração de ambiente multi-nó
- Utilização do
gpinitsystem
,gpssh
,gpstart
,gpstop
Módulo 4 – Administração e Gerenciamento
- Comandos administrativos (
gpstate
,gpconfig
,gp_toolkit
) - Gerenciamento de segment hosts
- Tarefas agendadas com
cron
- Atualização de parâmetros e configurações
Módulo 5 – Gerenciamento de Usuários e Segurança
- Criação e gerenciamento de usuários e roles
- Controle de acesso e autenticação
- SSL e criptografia
- Auditoria e logs de segurança
Módulo 6 – Armazenamento e Distribuição de Dados
- Tabelas distribuídas vs replicadas
- Estratégias de distribuição (
DISTRIBUTED BY
) - Compressão de dados
- Tabelas externas e uso com arquivos grandes
Módulo 7 – Monitoramento e Performance Tuning
- Métricas de desempenho com
gpperfmon
- Estatísticas e análise de planos de execução
- Monitoramento com ferramentas integradas
- Troubleshooting de queries lentas
Módulo 8 – Backup e Restore
- Backup completo com
gpcrondump
- Restore com
gpdbrestore
- Estratégias de snapshot
- Armazenamento em NFS/S3
Módulo 9 – Alta Disponibilidade e Recuperação
- Espelhamento de segmentos
- Failover manual e automático
- Substituição de hosts falhos
- Disaster recovery com Greenplum
Módulo 10 – Casos de Uso e Boas Práticas
- Workloads típicos e recomendações
- Integração com ferramentas de ETL e BI
- Casos de uso corporativos
- Melhores práticas de administração