Curso Hadoop Development Foundation

  • Big Data

Curso Hadoop Development Foundation

16 horas
Visão Geral

O Curso Hadoop Development Foundation fornece conhecimento sobre a estrutura Hadoop, que é a plataforma de fato para computação de Big Data. Apache Hadoop é uma estrutura de software de código aberto que oferece suporte a aplicativos distribuídos com uso intensivo de dados, licenciado sob a licença Apache v2. Ele suporta a execução de aplicativos em grandes clusters de hardware comum. A estrutura Hadoop fornece aos aplicativos de forma transparente confiabilidade e movimentação de dados. O Hadoop implementa um paradigma computacional chamado map/reduce, onde a aplicação é dividida em muitos pequenos fragmentos de trabalho, cada um dos quais pode ser executado ou reexecutado em qualquer nó do cluster. Além disso, fornece um sistema de arquivos distribuído que armazena dados nos nós do computador, fornecendo largura de banda agregada muito alta em todo o cluster.

 

Objetivo

No Curso Hadoop Development Foundation, os participantes aprenderão a:

  • Use a plataforma Hadoop e HDFS
  • Carregando dados no HDFS
  • Introdução ao MapReduce
  • Escrevendo e depurando jobs MapReduce
  • Implementando algoritmos comuns no Hadoop
  • Usando Mahout para mineração de dados avançada
  • Benchmarking e otimização de desempenho
Publico Alvo
  • Gerentes de projetos/programas/técnicos
  • Líderes técnicos/de equipe
  • Analistas/engenheiros de software
  • Consultor de pré-vendas
  • Gerentes de desenvolvimento de negócios
Pre-Requisitos
  • Alguma experiência em programação (preferencialmente Java)
  • Não é necessário conhecimento de Hadoop
Materiais
Inglês + Exercícios + Lab Pratico
Conteúdo Programatico

Hadoop and MapReduce: An Overview

  1. Big Data and the questions
  2. Hadoop and the answers
  3. Hadoop Cluster Configuration

Hadoop Internals and MapReduce Design Patterns

  1. Hadoop framework Internals
  2. MapReduce Internals
  3. MapReduce Design Patterns and Use-Cases

Hadoop sub-projects

  1. Hive
  2. Pig
  3. HBase
  4. Impala

Hadoop in Production

  1. Best practices for Hadoop cluster
  2. Best Practices for MapReduce
  3. Hadoop in the cloud
  4. Big Data and Social Media
TENHO INTERESSE

Cursos Relacionados

Curso Data Lake Inteligente Fundamentos para Analistas

16 horas

Curso Apache Spark and Scala

24 horas de curso pratico

Curso BigQuery Google Foudation

16 horas

Curso Bamboo Integração contínua

24 Horas

Curso Python 6 Projetos Python com Programacao Foundation to Advanced

60 horas

Curso Big Data Business Intelligence for Criminal Intelligence Analysis

40h

Curso Cloudera for Apache Kafka Overview

32 horas

Curso Cloudera Data Engineering Developing Applications with Apache Spark

32 horas