Visão Geral
Curso Apache Spark™ Programming with Databricks. Bem-vindo ao curso Apache Spark™ Programação com Databricks. Este Curso Apache Spark™ Programming with Databricks faz parte do caminho de aprendizagem Apache Spark™ Developer e foi desenvolvido para ajudá-lo a se preparar para o exame de certificação Apache Spark™ Developer. Observação: esta é a versão individualizada do curso Apache Spark™ Programming with Databricks ministrado por instrutor
Neste Curso Apache Spark™ Programming with Databricks, você explorará os fundamentos do Apache Spark™ e Delta Lake no Databricks. Você aprenderá os componentes arquitetônicos do Spark, as APIs DataFrame e Structured Streaming e como Delta Lake pode melhorar seus pipelines de dados. Por fim, você executará consultas de streaming para processar dados de streaming e compreenderá as vantagens de usar Delta Lake.
Objetivo
Após realizar este Curso Apache Spark™ Programming with Databricks com êxito você será capaz de:
- Definir os componentes arquitetônicos do Spark
- Descrever como os DataFrames são transformados, executados e otimizados no Spark
- Aplique a API DataFrame para explorar, pré-processar, unir e ingerir dados no Spark
- Aplique a API de streaming estruturado para realizar análises de dados de streaming
- Use Delta Lake para melhorar a qualidade e o desempenho dos pipelines de dados
Pre-Requisitos
- Familiaridade com conceitos e comandos SQL simples como SELECT, FILTER, GROUPBY, JOIN, etc.
- Experiência de nível iniciante com programação Python ou Scala.
Materiais
Inglês + Exercícios + Lab Pratico
Conteúdo Programatico
Apache Spark™ Programming with Databricks
- About this Course
- Course Logistics & Lab Environment
- Summary and Next Steps
Databricks and Apache Spark
- Introduction to Databricks and Apache Spark
- Working in the Databricks Workspace
- Explore Datasets Lab
Apache Spark Core
- Introduction to Apache Spark Core
- Spark SQL and the DataFrame API
- Spark SQL Lab
- DataFrameReader & DataFrameWriter
- Ingesting Data Lab
- DataFrame & Column
- Purchase Revenues Lab
Functions in Apache Spark
- Aggregation
- Revenue by Traffic Lab
- Datetimes
- Active Users Lab
- Complex Types
- Complex Types Demo
- Users Lab
- Additional Functions
- Additional Functions Demo
- Abandoned Carts Lab
- User-Defined Functions
- User-Defined Functions Demo
- Sort Day Lab
Apache Spark Architecture and Performance
- Performance and Query Optimization
- Memory Partitioning
- Partitioning Demo
- De-Duping Data Lab
Structured Streaming
- Introduction to Structured Streaming
- Streaming Queries Demo
- Coupon Sales Lab
- Hourly Activity by Traffic Lab
- Activity by Traffic Lab
- Streaming Aggregations
Delta Lake
- Introduction to Delta Lake
- Delta Lake Lab
Lab Walkthroughs
- Explore Datasets Lab Walkthrough
- Coupon Sales Lab Walkthrough
- Hourly Activity by Traffic Lab Walkthrough
- Delta Lake Lab Walkthrough
TENHO INTERESSE