Visão Geral
Neste Curso Big Data Essentials Bootcamp Operações lógicas, você aprenderá os fundamentos da arquitetura e execução de sistemas de Big Data.
Você obterá a experiência prática completa com nossa palestra exclusiva | Laboratório | Técnica de revisão , que irá imergir você no currículo, ajudando você a obter uma compreensão aprofundada de como usar as melhores práticas, ferramentas e técnicas essenciais na criação de aplicativos modernos de Big Data.
Seus instrutores especializados o guiarão por vários aplicativos, como Hadoop, NoSQL e Spark.
Você aprenderá a:
- Domine as melhores práticas de programação Hadoop em Pig, Hive e Java.
- Aprimore as soluções de Big Data para acesso a dados em tempo real com a ajuda de tecnologias NoSQL, como HBase e Cassandra.
- Entenda a diferença da modelagem de dados NoSQL em contraste com a modelagem de dados SQL.
- Utilize o Spark para análise de dados interativa com Scala ou SQL.
- Implemente o processamento analítico quase em tempo real com o Spark Streaming.
Objetivo
Após realizar este Curso Big Data Essentials Bootcamp Operações lógicas, você será capaz de:
- Domine as melhores práticas de programação Hadoop em Pig, Hive e Java.
- Aprimore as soluções de Big Data para acesso a dados em tempo real com a ajuda de tecnologias NoSQL, como HBase e Cassandra.
- Entenda a diferença da modelagem de dados NoSQL em contraste com a modelagem de dados SQL.
- Utilize o Spark para análise de dados interativa com Scala ou SQL.
- Implemente o processamento analítico quase em tempo real com o Spark Streaming.
Pre-Requisitos
- Antes de participar deste Curso Big Data Essentials Bootcamp Operações lógicas, você deve estar familiarizado com pelo menos uma linguagem de programação e se sentir confortável trabalhando com uma interface de linha de comando.
Materiais
Português/Inglês + Exercícios + Lab Pratico
Conteúdo Programatico
Big Data Overview
- Big Data
- Big Data Use Cases
- Designing a Big Data System
- Technologies: Hadoop
- Technologies: NoSQL
- Analytics
- Putting It All Together
Hadoop Introduction
- Introduction to Hadoop
- The Future of Hadoop
HDFS and MapReduce Primer
- HDFS
- MapReduce
- YARN
- Future of Hadoop Processing Engines
Hive
- Hadoopy, Hive, and SQL
- Hive Design and Architecture
- HiveQL
- First Look at Hive
- Hive Partitions
- Hive Joins
- Hive UDFs
- Text Analytics with Hive
Hive 2
- Data Access
- Feature Generation
- Filter/Search/Transpose
- Binning and Smoothing
- Tez
Pig
- Understand Apache Pig
- Pig Concepts/History
- Pig by Example
- Pig as an ETL Pipeline
Hadoop Cluster Planning
- Planning Hadoop Hardware
- Planning Software Install
Hadoop Install and Configure
- Different Installation Configurations in Hadoop
- Install Hadoop
- Configure Hadoop Cluster
- Common Configuration Properties
- Making Installation and Configuration Easier
- Hadoop Advanced Configuration
Hadoop Data Ingest
- Flume
- Sqoop
- REST
- Import Best Practices
NoSQL Intro
- RDBMS and NoSQL
- ACID in NoSQL
- CAP Theorem
- NoSQL Stores
- Columnar Storage
Cassandra Intro
- Introduction & Architecture
- Cassandra Use Cases
- Data Organization
- First Look at Cassandra
- Replication & Consistency
Cassandra Data Modeling 1
- Keyspaces and Tables
- CQL Queries
- Indexing
Cassandra Data Modeling 2
- Collections
- Composite Keys
- Time Series Data
- Counters
- Lightweight Transactions
Cassandra Data Modeling Labs
- MyFlix (Netflix)
- YouTube
- Online Shopping (Amazon)
- User Activity (Facebook)
Scala Primer
- Introduction
- Collections
- Functions/Methods
- Class/Object/Trait
Introduction to Spark
- Introduction
- Spark vs. Hadoop
- A First Look at Spark
Spark Data Model 1
- Data Model Overview
- RDD Concepts
- Spark Workflow
- Working with RDDs
- Key-Value Pairs
- Caching
Spark Data Model 2
- DataFrames
- Working with DataFrames
- Spark SQL
- DataSet
- Spark and Hive
- Data Formats
Spark API/Applications
- Core API
- Building and Running Applications
- Application Lifecycle
- Logging & Debugging
Machine Learning Primer
- Machine Learning Concepts
- Machine Learning Vocabulary
- Text Mining
- Recommendations
Spark Streaming
- Streaming
- Spark Streaming Overview
- Architecture
- Programming
- Structured Streaming
- Transformations
- Apache Kafka
TENHO INTERESSE