Curso Entendendo DAGs, Tasks e Operators no Airflow

  • DevOps | CI | CD | Kubernetes | Web3

Curso Entendendo DAGs, Tasks e Operators no Airflow

24 horas
Visão Geral

Este curso aprofunda os conceitos fundamentais do Apache Airflow, com foco específico em DAGs, Tasks e Operators, que formam a base de qualquer pipeline orquestrado. O aluno compreenderá como esses elementos se relacionam, como são definidos em Python e como impactam diretamente a confiabilidade, legibilidade e escalabilidade dos workflows. O curso é conceitual e prático, preparando o profissional para escrever DAGs bem estruturadas e alinhadas a boas práticas de engenharia de dados.

Objetivo

Após realizar este curso Entendendo DAGs, Tasks e Operators no Airflow, você será capaz de:

  • Compreender profundamente o conceito de DAG no Airflow
  • Definir e estruturar Tasks de forma correta
  • Utilizar Operators adequados para diferentes tipos de tarefas
  • Criar dependências claras e previsíveis entre tasks
  • Entender o ciclo de vida de uma DAG e de uma task
  • Evitar erros comuns na modelagem de workflows
  • Aplicar boas práticas de design e organização de DAGs
  • Ler e interpretar execuções e falhas no Airflow

 

Publico Alvo
  •  
  • Engenheiros de dados iniciantes e intermediários
  • Engenheiros de software que utilizam Airflow
  • Analistas de dados técnicos
  • Profissionais de TI envolvidos com automação de pipelines
  • Estudantes de tecnologia interessados em orquestração
  •  
Pre-Requisitos
  •  
  • Conhecimentos básicos de Python
  • Noções de linha de comando
  • Conceitos básicos de pipelines ou workflows
  • Familiaridade inicial com Apache Airflow
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Airflow Core Concepts

  1. What is Apache Airflow
  2. Workflow orchestration fundamentals
  3. Airflow execution model
  4. Role of DAGs, tasks and operators

Module 2: Understanding DAGs

  1. What is a DAG
  2. DAG structure and files
  3. DAG parameters and configuration
  4. Scheduling and execution dates

Module 3: DAG Lifecycle and Behavior

  1. Parsing and loading DAGs
  2. DAG runs and task instances
  3. Execution timeline
  4. Catchup and backfill concepts

Module 4: Tasks in Airflow

  1. What is a task
  2. Task instances
  3. Task states and transitions
  4. Retries, delays and timeouts

Module 5: Operators Fundamentals

  1. What is an operator
  2. Action vs sensor vs transfer operators
  3. Built-in operators overview
  4. Choosing the right operator

Module 6: Commonly Used Operators

  1. BashOperator
  2. PythonOperator
  3. DummyOperator and EmptyOperator
  4. Branching operators

Module 7: Defining Dependencies

  1. Upstream and downstream
  2. Bitshift operators
  3. Complex dependency patterns
  4. Parallel and conditional execution

Module 8: Best Practices for DAG Design

  1. Readable DAG structure
  2. Idempotent task design
  3. Avoiding anti-patterns
  4. Organizing DAG code

Module 9: Debugging and Troubleshooting

  1. Understanding logs
  2. Common DAG errors
  3. Task failure analysis
  4. Testing DAGs locally

Module 10: Preparing for Advanced Airflow Usage

  1. Dynamic DAGs overview
  2. Custom operators introduction
  3. Sensors and event-driven pipelines
  4. Next steps in Airflow mastery
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h