Curso SQL Basico on Databricks
16 horasVisão Geral
O curso SQL Básico on Databricks tem como objetivo capacitar profissionais com conhecimentos essenciais em SQL e no ambiente Databricks, preparando-os para treinamentos mais avançados como o "Databricks SQL from the Experts". Através de uma abordagem prática e objetiva, os participantes aprenderão desde a sintaxe básica do SQL até a execução de consultas no ambiente Databricks SQL, utilizando notebooks, visualizações e painéis interativos.
Este Curso SQL Básico on Databricks é ideal como pré-requisito para nivelar a equipe tecnicamente, garantindo engajamento e compreensão sólida durante cursos especializados em engenharia e análise de dados no Databricks.
Este curso oferece uma introdução prática à linguagem SQL utilizando o ambiente Databricks. Além dos fundamentos da linguagem SQL, o aluno será introduzido ao conceito de processamento distribuído com Apache Spark, aprendendo como o SQL é utilizado dentro do Spark para consultas otimizadas em grandes volumes de dados.
Objetivo
Após realizar este curso SQL Básico on Databricks, você será capaz de:
- Compreender os fundamentos do SQL (DDL, DML, DQL)
- Compreender os fundamentos da linguagem SQL no contexto de big data.
- Criar e manipular tabelas no Databricks
- Utilizar o Databricks para escrever e executar consultas SQL.
- Executar consultas simples e intermediárias usando SQL
- Navegar pela interface Databricks SQL
- Criar notebooks, dashboards e visualizações
- Trabalhar com dados estruturados em ambientes de Lakehouse
- Aplicar conceitos básicos do Apache Spark para entender o processamento distribuído.
- Criar, manipular e consultar dados armazenados em tabelas Spark SQL.
Publico Alvo
- Profissionais de dados iniciantes
- Analistas de negócios e BI
- Desenvolvedores que atuarão com SQL no Databricks
- Times técnicos que participarão de treinamentos avançados Databricks
- Iniciantes em SQL que desejam usar a linguagem dentro de ambientes Big Data.
- Analistas de dados, engenheiros e cientistas de dados em início de jornada.
- Profissionais de TI que querem aprender como consultar dados no Databricks com SQL.
Pre-Requisitos
- Nenhum conhecimento prévio de SQL é necessário
- Desejável familiaridade com conceitos básicos de dados
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Módulo 1 – Introdução ao Databricks e Apache Spark
- O que é o Databricks e seu papel em ambientes de Big Data
- Visão geral do Apache Spark
- Engine de processamento distribuído
- Diferenciação entre Spark e SGBDs tradicionais
- Spark SQL: o SQL dentro do Apache Spark
- Criando e navegando em workspaces no Databricks
- Noções básicas de notebooks Databricks
Módulo 2 – Fundamentos do SQL no Databricks
- O que é SQL?
- Executando comandos SQL no notebook Databricks
- Comando SELECT
- Seleção de colunas
- Uso de aliases
- Comando WHERE
- Filtros simples
- Operadores lógicos: AND, OR, NOT
- Comando ORDER BY
- Ordenação ascendente e descendente
Módulo 3 – Operações de Agregação
- Funções de agregação: COUNT, SUM, AVG, MIN, MAX
- Agrupando dados com GROUP BY
- Filtrando grupos com HAVING
- Consultas de resumo em grandes volumes de dados com Spark SQL
Módulo 4 – Junções de Tabelas no Spark SQL
- INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL JOIN
- Esquemas de tabelas no Databricks
- Estratégias de otimização em joins com grandes volumes de dados
- Usando aliases para simplificar joins
Módulo 5 – Criação e Manipulação de Tabelas
- Criando tabelas no Databricks com SQL
- Tabelas gerenciadas vs externas
- Especificando esquemas
- Inserindo dados (INSERT INTO)
- Atualizando dados (UPDATE)
- Excluindo dados (DELETE)
- Carregando dados a partir de arquivos CSV/Parquet
Módulo 6 – Subconsultas, Views e CTEs
- Subconsultas no SELECT e WHERE
- Common Table Expressions (CTEs) com WITH
- Criando e utilizando views no Databricks
- Boas práticas para consultas reutilizáveis
Módulo 7 – Introdução à Otimização com Spark SQL
- O que é o Catalyst Optimizer?
- Como o Spark transforma SQL em planos de execução
- Conceitos de Lazy Evaluation
- Visualizando e interpretando planos de execução no Databricks
Módulo 8 – Projeto Final Prático
- Desafio: análise de dados de vendas com SQL no Databricks
- Criação de tabelas
- Carregamento de dados
- Execução de consultas com joins, agregações e filtros
- Criação de uma view para relatório final
- Apresentação das soluções