Curso Entendendo DAGs, Tasks e Operators no Airflow

  • DevOps | CI | CD | Kubernetes | Web3

Curso Entendendo DAGs, Tasks e Operators no Airflow

24 horas
Visão Geral

Este curso aprofunda os conceitos fundamentais do Apache Airflow, com foco específico em DAGs, Tasks e Operators, que formam a base de qualquer pipeline orquestrado. O aluno compreenderá como esses elementos se relacionam, como são definidos em Python e como impactam diretamente a confiabilidade, legibilidade e escalabilidade dos workflows. O curso é conceitual e prático, preparando o profissional para escrever DAGs bem estruturadas e alinhadas a boas práticas de engenharia de dados.

Objetivo

Após realizar este curso Entendendo DAGs, Tasks e Operators no Airflow, você será capaz de:

  • Compreender profundamente o conceito de DAG no Airflow
  • Definir e estruturar Tasks de forma correta
  • Utilizar Operators adequados para diferentes tipos de tarefas
  • Criar dependências claras e previsíveis entre tasks
  • Entender o ciclo de vida de uma DAG e de uma task
  • Evitar erros comuns na modelagem de workflows
  • Aplicar boas práticas de design e organização de DAGs
  • Ler e interpretar execuções e falhas no Airflow

 

Publico Alvo
  •  
  • Engenheiros de dados iniciantes e intermediários
  • Engenheiros de software que utilizam Airflow
  • Analistas de dados técnicos
  • Profissionais de TI envolvidos com automação de pipelines
  • Estudantes de tecnologia interessados em orquestração
  •  
Pre-Requisitos
  •  
  • Conhecimentos básicos de Python
  • Noções de linha de comando
  • Conceitos básicos de pipelines ou workflows
  • Familiaridade inicial com Apache Airflow
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Airflow Core Concepts

  1. What is Apache Airflow
  2. Workflow orchestration fundamentals
  3. Airflow execution model
  4. Role of DAGs, tasks and operators

Module 2: Understanding DAGs

  1. What is a DAG
  2. DAG structure and files
  3. DAG parameters and configuration
  4. Scheduling and execution dates

Module 3: DAG Lifecycle and Behavior

  1. Parsing and loading DAGs
  2. DAG runs and task instances
  3. Execution timeline
  4. Catchup and backfill concepts

Module 4: Tasks in Airflow

  1. What is a task
  2. Task instances
  3. Task states and transitions
  4. Retries, delays and timeouts

Module 5: Operators Fundamentals

  1. What is an operator
  2. Action vs sensor vs transfer operators
  3. Built-in operators overview
  4. Choosing the right operator

Module 6: Commonly Used Operators

  1. BashOperator
  2. PythonOperator
  3. DummyOperator and EmptyOperator
  4. Branching operators

Module 7: Defining Dependencies

  1. Upstream and downstream
  2. Bitshift operators
  3. Complex dependency patterns
  4. Parallel and conditional execution

Module 8: Best Practices for DAG Design

  1. Readable DAG structure
  2. Idempotent task design
  3. Avoiding anti-patterns
  4. Organizing DAG code

Module 9: Debugging and Troubleshooting

  1. Understanding logs
  2. Common DAG errors
  3. Task failure analysis
  4. Testing DAGs locally

Module 10: Preparing for Advanced Airflow Usage

  1. Dynamic DAGs overview
  2. Custom operators introduction
  3. Sensors and event-driven pipelines
  4. Next steps in Airflow mastery
TENHO INTERESSE

Cursos Relacionados

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Ansible Overview of Ansible architecture

16h

Curso Apache NiFi e Hadoop DataFlow Engineering

40 horas

Curso Apache Kafka Data Streaming

24 horas

Curso Python Software Development

24 horas