Visão Geral
O Curso Apache Flink Preparatório para Certificação é desenvolvido por especialistas em Big Data para facilitar o conhecimento teórico e prático do sistema de processamento de dados em lote e fluxo distribuído do Apache Flink - The Next Gen Big Data Analytics Framework.
Sobre o Curso Apache Flink Preparatório para Certificação
O Curso Apache Flink Preparatório para Certificação, fornecerá habilidades teóricas e práticas profundas sobre o Apache Flink para torná-lo pronto para a indústria para a execução de programas de processamento em lote e fluxo.
Ele cobrirá conceitos como Introdução ao Apache Flink para Spark Developer, recursos do Apache Flink, arquitetura e instalação do Flink em um único nó e cluster, Flink Stack, APIs e bibliotecas do Flink, implantação do Flink no YARN, Kafka e Hadoop, casos de uso do Apache Flink em tempo real e exemplos do Apache Flink junto com empresas que usam o Apache Flink e muito mais para ajudá-lo a aprender os conceitos do Apache Flink do nível básico ao avançado, abrangendo a versão mais recente para as certificações do Apache Flink.
Aprenda Apache Flink e torne-se um especialista em Flink aprendendo técnicas básicas, práticas recomendadas e conhecimento prático de Flink junto com seu ecossistema, como APIs de lote e streaming, APIs de tabela, Flink-ML, Gelly por meio do tutorial do Apache Flink.
- Torne-se adepto da mais recente tecnologia de Big Data - 'Apache Flink' e esteja pronto para o futuro
- Domine os principais conceitos internos do Apache Flink
- Aprenda a arquitetura de streaming de dados com Apache Flink
- Aprenda a lidar com diversas cargas de trabalho com Apache Flink
- Configuração de cluster Flink de vários nós na nuvem
- Obtenha conhecimento aprofundado no Flink Stack
- Compreenda os conceitos fundamentais das bibliotecas e APIs do Flink
- Aprenda o desenvolvimento de aplicativos Flink de streaming em tempo real
- Lidar com dados estruturados usando Table-API
- Realize análises avançadas usando Flink ML - Exemplo de aprendizado de máquina Flink
- Gráfico de processo em scala usando Gelly - API Flink Graph
- Processamento de eventos complexos usando Apache Flink - Flink CEP
- Integre com diferentes sistemas de Big Data
- Trabalhe no Projeto Flink em tempo real
Publico Alvo
Profissionais que buscam fazer sua carreira na mais recente e mais rápida tecnologia de Big Data Apache Flink devem fazer este curso.
Desenvolvedores de software, leads e gerentes de projeto que gostariam de incluir Flink em seus perfis
Desenvolvedores de ETL, profissionais de análise e arquitetos
Profissionais de Big Data dispostos a acelerar sua carreira como desenvolvedor Flink
Para aprender o Apache Flink, o conhecimento do núcleo do java será útil, mas não é obrigatório. O curso Java será fornecido como um curso complementar com este treinamento Flink.
Conteúdo Programatico
Demystify Scala
- Introduction to Scala
- Setup, Installation and configuration of Scala
- Develop and execute Scala Programs
- Scala operators and features
- Different Functions, procedures and Anonymous functions
- Deep dive into Scala APIs
- Collections Array, Map, Lists, Tuples and Loops
- Advanced operations - Pattern matching
- Eclipse IDE with Scala
Object Oriented and Functional Programming
- Object oriented programming
- Oops concepts
- Constructor, getter, setter, singleton, overloading and overriding
- Type Inference, Implicit Parameters, Closures
- Lists, Maps and Map Operations
- Nested Classes, Visibility Rules
- Functional Structures
- Functional programming constructs
Introduction to Apache Flink
- Learn What and why Apache Flink
- Understand Features of Apache Flink
- Apache Flink architecture and Flink design principles
- Work of master process - JobManager
- Role of worker process - TaskManager
- Workers, Slots and Resources
- Overview of Apache Flink APIs
- Understand difference between Apache Spark and Apache Flink to learn Flink vs Spark.
Master Flink Stack
- Distributed Streaming DataFlow at Runtime with Flink
- Apache Flink APIs
- Apache Flink Libraries
- Data Flow in Apache Flink
- Fault tolerance in Apache Flink
Setup and Installation of single node Flink
- Setup of Apache Flink environment and pre-requisites
- Installation and configuration of Flink on single node
- Troubleshooting the encountered problems
Setup and Installation of multi node Flink cluster and Cloud
- Setup environment on Cloud
- Install pre-requisites on all nodes
- Deploy Apache Flink on cluster and Cloud
- Play with Flink in cluster mode
Master DataStream API for Unbounded Streams
- Introduction to Flink DataStream API
- Different DataStream Transformations in Flink
- Various Data Sources - File based, Socket based, Collection based, Custom
- Responsibility of Data Sink in Apache Flink
- Iterations in DataStream APIs
- DataStream Execution Parameters - Fault tolerance, Controlling Latency
Learn Flink DataSet APIs for Static Data
- Overview of DataSet APIs in Flink
- Various DataSet Transformations in Flink
- Different Data Sources - File based, Collection based, Generic
- Responsibility of Data Sink in Flink DataSet APIs
- Iteration Operators in DataSet APIs
- Operating on Data Objects in Functions - Object Reuse Disabled/Enabled
Play with Flink Table APIs and SQL Beta
- Registering Tables in Flink
- Table Access and various Table API operators in Flink
- SQL on batch tables and Streaming Tables
- Writing Flink Tables to external sinks
Apache Flink Libraries
- Overview of Flink Libraries
- Flink CEP - Complex Event Processing library
- Apache Flink Machine Learning library
- Apache Flink Gelly -Graph processing API and Library
Flink Integration with other Big data tools
- Integrate Flink with Hadoop
- Process existing HDFS data with Flink
- Yarn and Flink integration
- Flink Data Streaming with Kafka
- Consume data in real time from Kafka
Programming in Flink
- Parallel Data Flow in Flink
- Develop complex Streaming applications in Flink
- Handle Batch processing in Flink using DataSet APIs
- Troubleshooting and Debugging Flink Programs
- Best Practices of development in Flink
- Real time Apache Flink Project