Curso Apache Kudu

  • DevOps | CI | CD | Kubernetes | Web3

Curso Apache Kudu

16 horas
Visão Geral

Este Curso Apache Kudu cobre os conceitos básicos do Apache Kudu, um sistema de armazenamento de dados para a plataforma Hadoop otimizado para consultas analíticas. O curso cobre casos de uso comuns do Kudu e arquitetura Kudu. Você aprenderá como criar, gerenciar e consultar tabelas Kudu e desenvolver aplicativos Spark que usam Kudu.

Objetivo

Ao participar do Curso Apache Kudu, os participantes aprenderão:

  • Uma explicação de alto nível do Kudu
  • Como ele se compara a outros sistemas de armazenamento relevantes e quais casos de uso seriam melhor implementados com o Kudu
  • Sobre a arquitetura do Kudu e também como projetar tabelas que armazenarão dados para desempenho ideal.
  • Técnicas de gerenciamento de dados sobre como inserir, atualizar ou excluir registros de tabelas Kudu usando Impala, bem como métodos de carregamento em massa
  • Por fim, desenvolva aplicativos Apache Spark com Apache Kudu
Publico Alvo

Curso Apache Kudu é ideal para:

  • Desenvolvedores de software, engenheiros de dados, DBAs, cientistas de dados e analistas de dados.
Pre-Requisitos
  • Conhecimento de SQL.
  • A familiaridade com o Impala é preferida, mas não obrigatória.
  • Conhecimento para desenvolver aplicações Apache Spark usando Python ou Scala.
  • É esperada experiência básica em Linux.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Introduction

Overview and Architecture

  1. What Is Kudu?
  2. Why Use Kudu?
  3. Kudu Use Cases
  4. Architecture Overview
  5. Kudu Tools

Apache Kudu Tables

  1. Kudu Tables
  2. Data Storage Options
  3. Designing Schemas
  4. Partitioning Tables for Best Performance
  5. Using Kudu Tools with Tables

Using Apache Kudu with Apache Impala

  1. Apache Impala Overview
  2. Creating and Querying Tables
  3. Deleting Tables
  4. Loading and Modifying Data in Kudu Tables
  5. Defining Partitioning Strategy

Developing Apache Spark Applications with Apache Kudu

  1. Apache Spark and Apache Kudu
  2. Kudu, Spark SQL, and DataFrames
  3. Managing Kudu Table Data with Scala
  4. Creating Kudu Tables with Scala
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h