curso ClickHouse Fundamentals

  • DevOps | CI | CD | Kubernetes | Web3

curso ClickHouse Fundamentals

24 horas
Visão Geral

O curso ClickHouse Fundamentals apresenta os conceitos essenciais e as práticas recomendadas para trabalhar com ClickHouse, um sistema de gerenciamento de banco de dados analítico de código aberto. Ideal para engenheiros de dados, cientistas de dados e administradores de banco de dados, este curso ClickHouse Fundamentals oferece uma visão geral das funcionalidades e arquiteturas do ClickHouse, além de como otimizar consultas e gerenciar dados em larga escala.

Objetivo
  • Compreender a arquitetura e os principais componentes do ClickHouse.
  • Aprender a instalar e configurar um servidor ClickHouse.
  • Dominar as consultas SQL no ClickHouse.
  • Implementar tabelas, índices e otimizações para melhorar o desempenho.
  • Explorar estratégias de particionamento e shardings em ambientes distribuídos.
Publico Alvo
  • Engenheiros de dados que desejam aprender sobre soluções de banco de dados analítico.
  • Cientistas de dados interessados em otimizar grandes volumes de dados para análise rápida.
  • Administradores de banco de dados que buscam entender o ClickHouse para análise de dados em tempo real.
Pre-Requisitos
  • Conhecimento básico de SQL.
  • Noções de sistemas de gerenciamento de banco de dados.
  • Experiência com ambientes Linux é um diferencial.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Módulo 1: Introdução ao ClickHouse

  1. O que é ClickHouse e seus casos de uso.
  2. Comparação com outros bancos de dados analíticos.
  3. Principais características: OLAP, alta performance e compressão de dados.
  4. Arquitetura do ClickHouse: Columnar Store e MergeTree.

Módulo 2: Instalação e Configuração do ClickHouse

  1. Requisitos do sistema para instalar o ClickHouse.
  2. Instalando ClickHouse em ambientes Linux e Docker.
  3. Configuração básica e parâmetros de inicialização.
  4. Ferramentas de administração e monitoramento.

Módulo 3: Noções Básicas de SQL no ClickHouse

  1. Diferenças entre o SQL tradicional e o SQL no ClickHouse.
  2. Sintaxe básica para consultas e manipulação de dados.
  3. Funções e agregações disponíveis no ClickHouse.
  4. Exemplos práticos de consultas analíticas.

Módulo 4: Estruturação e Criação de Tabelas

  1. Criação de tabelas no ClickHouse.
  2. Tipos de dados suportados e suas particularidades.
  3. Uso de tabelas MergeTree e suas variações.
  4. Implementação de tabelas com otimizações para leitura rápida.

Módulo 5: Gerenciamento de Índices e Particionamento

  1. Índices primários e skip indices.
  2. Particionamento de dados: como e quando utilizar.
  3. Otimização de consultas com particionamento inteligente.
  4. Exemplo prático de criação de índices e particionamento.

Módulo 6: Estratégias de Sharding e Distribuição de Dados

  1. Introdução ao sharding no ClickHouse.
  2. Configuração e gerenciamento de clusters distribuídos.
  3. Como balancear a carga de consultas em clusters grandes.
  4. Implementação de um cluster distribuído para alto volume de dados.

Módulo 7: Importação e Exportação de Dados

  1. Formatos de dados suportados (CSV, TSV, JSON, etc.).
  2. Carregamento de grandes volumes de dados no ClickHouse.
  3. Exportação de dados para análise externa.
  4. Exemplos de carga de dados massiva com otimização de performance.

Módulo 8: Performance e Otimização

  1. Fatores que influenciam o desempenho do ClickHouse.
  2. Técnicas de otimização de consultas.
  3. Gerenciamento de memória e cache.
  4. Práticas recomendadas para maximizar o desempenho em grandes volumes de dados.

Módulo 9: Monitoramento e Administração do ClickHouse

  1. Uso do ClickHouse system tables para monitoramento.
  2. Configuração de logs e métricas de performance.
  3. Ferramentas para análise de desempenho e troubleshooting.
  4. Manutenção e backup de bases de dados no ClickHouse.

Módulo 10: Casos de Uso e Boas Práticas

  1. Exemplos de utilização do ClickHouse em diferentes indústrias.
  2. Como estruturar dados para análise eficiente.
  3. Integração do ClickHouse com outras ferramentas analíticas.
  4. Boas práticas para gerenciar e operar clusters ClickHouse.

Avaliação:

  • Exercícios práticos no final de cada módulo.
  • Projeto final: Implementação de um banco de dados ClickHouse para análise de um grande conjunto de dados, otimizando consultas e particionando os dados corretamente.
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h