Visão Geral
Apache Hadoop é uma das estruturas mais populares para processamento de Big Data em clusters de servidores. Este curso se concentra em técnicas avançadas de programação que serão benéficas para desenvolvedores Hadoop experientes.
Objetivo
Após realisar este Curso Advanced Hadoop For Developers, você será capaz de:
- Porco Avançado
- Colmeia Avançada
- HBase avançado (SQL)
Publico Alvo
Desenvolvedores
Pre-Requisitos
- Confortável com a linguagem de programação Java (a maioria dos exercícios de programação são em java)
- Confortável em ambiente Linux (ser capaz de navegar na linha de comando do Linux, editar arquivos usando vi/nano)
- Frequentou o “Hadoop for Developers” ou tem conhecimento prático de Hadoop.
Informações Gerais
Curso Hadoop For Developers Advanced
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Data Management in HDFS
- Various Data Formats (JSON / Avro / Parquet)
- Compression Schemes
- Data Masking
- Labs : Analyzing different data formats; enabling compression
Advanced Pig
- User-defined Functions
- Introduction to Pig Libraries (ElephantBird / Data-Fu)
- Loading Complex Structured Data using Pig
- Pig Tuning
- Labs : advanced pig scripting, parsing complex data types
Advanced Hive
- User-defined Functions
- Compressed Tables
- Hive Performance Tuning
- Labs : creating compressed tables, evaluating table formats and configuration
Section 4 : Advanced HBase
- Schema Modelling
- Compression
- Bulk Data Ingest
- Wide-table / Tall-table comparison
- HBase and Pig
- HBase and Hive
- HBase Performance Tuning
- Labs : tuning HBase; accessing HBase data from Pig & Hive; Using Phoenix for data modeling
TENHO INTERESSE