Curso Apache Kudu

  • DevOps | CI | CD | Kubernetes | Web3

Curso Apache Kudu

16 horas
Visão Geral

Este Curso Apache Kudu cobre os conceitos básicos do Apache Kudu, um sistema de armazenamento de dados para a plataforma Hadoop otimizado para consultas analíticas. O curso cobre casos de uso comuns do Kudu e arquitetura Kudu. Você aprenderá como criar, gerenciar e consultar tabelas Kudu e desenvolver aplicativos Spark que usam Kudu.

Objetivo

Ao participar do Curso Apache Kudu, os participantes aprenderão:

  • Uma explicação de alto nível do Kudu
  • Como ele se compara a outros sistemas de armazenamento relevantes e quais casos de uso seriam melhor implementados com o Kudu
  • Sobre a arquitetura do Kudu e também como projetar tabelas que armazenarão dados para desempenho ideal.
  • Técnicas de gerenciamento de dados sobre como inserir, atualizar ou excluir registros de tabelas Kudu usando Impala, bem como métodos de carregamento em massa
  • Por fim, desenvolva aplicativos Apache Spark com Apache Kudu
Publico Alvo

Curso Apache Kudu é ideal para:

  • Desenvolvedores de software, engenheiros de dados, DBAs, cientistas de dados e analistas de dados.
Pre-Requisitos
  • Conhecimento de SQL.
  • A familiaridade com o Impala é preferida, mas não obrigatória.
  • Conhecimento para desenvolver aplicações Apache Spark usando Python ou Scala.
  • É esperada experiência básica em Linux.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Introduction

Overview and Architecture

  1. What Is Kudu?
  2. Why Use Kudu?
  3. Kudu Use Cases
  4. Architecture Overview
  5. Kudu Tools

Apache Kudu Tables

  1. Kudu Tables
  2. Data Storage Options
  3. Designing Schemas
  4. Partitioning Tables for Best Performance
  5. Using Kudu Tools with Tables

Using Apache Kudu with Apache Impala

  1. Apache Impala Overview
  2. Creating and Querying Tables
  3. Deleting Tables
  4. Loading and Modifying Data in Kudu Tables
  5. Defining Partitioning Strategy

Developing Apache Spark Applications with Apache Kudu

  1. Apache Spark and Apache Kudu
  2. Kudu, Spark SQL, and DataFrames
  3. Managing Kudu Table Data with Scala
  4. Creating Kudu Tables with Scala
TENHO INTERESSE

Cursos Relacionados

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Ansible Overview of Ansible architecture

16h

Curso Algorithms and Data Structures

24 horas

Curso Object-Oriented Programming with Python

24 horas

Curso Python Scripting and Automation Basics

24 horas

Curso Python Debugging and Error Handling

24 horas

Curso Cloud Bursting with Virtual Kubelet

24 horas