Visão Geral
Curso Apache Zeppelin, Apache Zeppelin é um notebook baseado na web para capturar, explorar, visualizar e compartilhar dados baseados em Hadoop e Spark. O curso de treinamento Apache Zeppelin apresenta os conceitos por trás da análise de dados interativa e percorre a implantação e o uso do Zeppelin em um ambiente de usuário único ou multiusuário.
Objetivo
Ao participar do Curso Apache Zeppelin, os participantes aprenderão a:
- Instalar e configurar o Zeppelin
- Desenvolva, organize, execute e compartilhe dados em uma interface baseada em navegador
- Visualize os resultados sem consultar a linha de comando ou os detalhes do cluster
- Execute e colabore em fluxos de trabalho longos
- Trabalhe com qualquer um dos vários back-ends de linguagem/processamento de dados de plug-in, como Scala (com Apache Spark), Python (com Apache Spark), Spark SQL, JDBC, Markdown e Shell.
- Integre Zeppelin com Spark, Flink e Map Reduce
- Instâncias multiusuário seguras do Zeppelin com Apache Shiro
Publico Alvo
Curso Apache Zeppelin é ideal para:
- Engenheiros de dados
- Analistas de dados
- Cientistas de dados
- Desenvolvedores de software
Pre-Requisitos
- Uma compreensão dos conceitos de big data
- Experiência com Spark e Hadoop
- Experiência com linha de comando
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
- Introduction
- Installing and Configuring Zeppelin
- Overview of Zeppelin Features and Architecture
- Navigating the Browser Interface
- Understanding the Data Analysis Workflow
- Organizing Data for Analysis
- Visualizing Data
- Sharing Data and Collaborating with Other Analysists
- Working with Plug-ins
- Backend Data Processing
- Working with Scala and Apache Spark
- Working with Python and Apache Spark
- Working with Spark SQL
- Working with JDBC
- Using Markdown and Shell
- Integrating Zeppelin with Spark, Flink and Map Reduce
- Setting up and Securing Multi-user Instances
- Troubleshooting
TENHO INTERESSE