Visão Geral
Este Curso Advanced Apache Airflow vai além dos fundamentos para ensinar aos participantes como criar DAGs (gráficos acíclicos direcionados) mais sofisticados e aplicar práticas de segurança ao Apache Airflow. Além disso, os alunos aprendem como dimensionar o Airflow no Kubernetes.
Objetivo
Após realizar este Curso Advanced Apache Airflow você será capaz de:
- Proteja sua instalação do Apache Airflow
- Crie DAGs altamente simultâneos no Kubernetes
- Aproveite a maior parte das novas funcionalidades que o Airflow 2.x traz
Pre-Requisitos
Todos os alunos devem ter feito Introdução ao Apache Airflow ou ter conhecimento equivalente.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Introduction
Creating DAGs
- Secrets, connections, and variables
- Creating connections on startup
- Using Pools for long-running and demanding tasks
- Simulating long-running tasks
- DAG serialization
- DAG versioning
- Testing DAGs
- CI/CD in Airflow
Modularizing DAGs
- TaskGroups vs subDAGs
- TaskFlowAPI and XComs
- Modularizing
- Dynamic and Functional DAGs
- SmartSensors and timeouts
Airflow Security
- RBAC in Airflow
- Setting up OAuth authentication
- Add Google OAuth
- Adding SSL certs
- Default Roles and custom roles
- Creating a custom role
Airflow in Kubernetes
- The Helm chart
- Deploying Airflow with Helm
- Deploying single tasks to Kubernetes: KubernetesPodOperator
- Adding a task in Kubernetes
- Scaling Airflow with Kubernetes executor
- Changing the Helm charts values
- KEDA autoscaler
- Preparing DAGs for Kubernetes
- Creating a DAG fully in Kubernetes
- The CeleryKubernetes executor for extreme scalability
Upgrading from Airflow 1.10
- Conclusion
TENHO INTERESSE