Curso SMACK Stack for Data Science
16 horasVisão Geral
Curso SMACK Stack for Data Science, SMACK é uma coleção de softwares de plataforma de dados, ou seja, Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra e Apache Kafka. Usando a pilha SMACK, os usuários podem criar e dimensionar plataformas de processamento de dados.
Objetivo
Após realizar este Curso SMACK Stack for Data Science, você será capaz de:
- Implemente uma arquitetura de pipeline de dados para processar big data.
- Desenvolva uma infraestrutura de cluster com Apache Mesos e Docker.
- Analise dados com Spark e Scala.
- Gerencie dados não estruturados com o Apache Cassandra.
Publico Alvo
- Cientistas de Dados
- Analista de Sistema
- Desenvolvedores,
Materiais
Português/Inglês + Exercícios + Lab PraticoConteúdo Programatico
Introduction
- SMACK Stack Overview
- What is Apache Spark? Apache Spark features
- What is Apache Mesos? Apache Mesos features
- What is Apache Akka? Apache Akka features
- What is Apache Cassandra? Apache Cassandra features
- What is Apache Kafka? Apache Kafka features
Scala Language
- Scala syntax and structure
- Scala control flow
Preparing the Development Environment
- Installing and configuring the SMACK stack
- Installing and configuring Docker
Apache Akka
- Using actors
Apache Cassandra
- Creating a database for read operations
- Working with backups and recovery
Connectors
- Creating a stream
- Building an Akka application
- Storing data with Cassandra
- Reviewing connectors
Apache Kafka
- Working with clusters
- Creating, publishing, and consuming messages
Apache Mesos
- Allocating resources
- Running clusters
- Working with Apache Aurora and Docker
- Running services and jobs
- Deploying Spark, Cassandra, and Kafka on Mesos
Apache Spark
- Managing data flows
- Working with RDDs and dataframes
- Performing data analysis
Troubleshooting
- Handling failure of services and errors