Visão Geral
Este Curso Apache Kudu cobre os conceitos básicos do Apache Kudu, um sistema de armazenamento de dados para a plataforma Hadoop otimizado para consultas analíticas. O curso cobre casos de uso comuns do Kudu e arquitetura Kudu. Você aprenderá como criar, gerenciar e consultar tabelas Kudu e desenvolver aplicativos Spark que usam Kudu.
Objetivo
Ao participar do Curso Apache Kudu, os participantes aprenderão:
- Uma explicação de alto nível do Kudu
- Como ele se compara a outros sistemas de armazenamento relevantes e quais casos de uso seriam melhor implementados com o Kudu
- Sobre a arquitetura do Kudu e também como projetar tabelas que armazenarão dados para desempenho ideal.
- Técnicas de gerenciamento de dados sobre como inserir, atualizar ou excluir registros de tabelas Kudu usando Impala, bem como métodos de carregamento em massa
- Por fim, desenvolva aplicativos Apache Spark com Apache Kudu
Publico Alvo
Curso Apache Kudu é ideal para:
- Desenvolvedores de software, engenheiros de dados, DBAs, cientistas de dados e analistas de dados.
Pre-Requisitos
- Conhecimento de SQL.
- A familiaridade com o Impala é preferida, mas não obrigatória.
- Conhecimento para desenvolver aplicações Apache Spark usando Python ou Scala.
- É esperada experiência básica em Linux.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Introduction
Overview and Architecture
- What Is Kudu?
- Why Use Kudu?
- Kudu Use Cases
- Architecture Overview
- Kudu Tools
Apache Kudu Tables
- Kudu Tables
- Data Storage Options
- Designing Schemas
- Partitioning Tables for Best Performance
- Using Kudu Tools with Tables
Using Apache Kudu with Apache Impala
- Apache Impala Overview
- Creating and Querying Tables
- Deleting Tables
- Loading and Modifying Data in Kudu Tables
- Defining Partitioning Strategy
Developing Apache Spark Applications with Apache Kudu
- Apache Spark and Apache Kudu
- Kudu, Spark SQL, and DataFrames
- Managing Kudu Table Data with Scala
- Creating Kudu Tables with Scala
TENHO INTERESSE