Visão Geral
Este curso apresenta uma introdução completa ao Apache Airflow com foco em Python, cobrindo desde os conceitos fundamentais de orquestração de workflows até a criação, execução e monitoramento de DAGs. O aluno aprenderá como o Airflow organiza pipelines de dados, automatiza tarefas e gerencia dependências, utilizando Python como linguagem principal para definição de workflows. O curso equilibra teoria e prática, preparando o iniciante para utilizar o Airflow em cenários reais de engenharia de dados e automação.
Conteúdo Programatico
Module 1: Introduction to Apache Airflow
- What is Apache Airflow
- Workflow orchestration concepts
- When to use Airflow
- Common use cases
Module 2: Airflow Architecture and Components
- Scheduler
- Webserver
- Metadata database
- Executor and workers
Module 3: Setting Up Airflow Environment
- Python virtual environments
- Installing Airflow
- Initial configuration
- Running Airflow locally
Module 4: Understanding DAGs
- What is a DAG
- DAG structure and files
- DAG parameters
- Scheduling concepts
Module 5: Tasks and Operators
- What is a task
- BashOperator
- PythonOperator
- Task dependencies
Module 6: Writing DAGs with Python
- Basic DAG creation
- Defining tasks with Python functions
- Passing parameters
- Organizing DAG code
Module 7: Monitoring and Debugging
- Airflow UI overview
- Logs and task states
- Handling failures
- Retrying tasks
Module 8: Best Practices for Beginners
- DAG naming conventions
- Code organization
- Simple performance considerations
- Next steps in Airflow learning