Visão Geral
O curso Data Governance Engineering aborda os fundamentos, arquiteturas e práticas técnicas necessárias para implementar governança de dados em ambientes corporativos modernos. O treinamento explora como estruturar políticas, processos e tecnologias para garantir qualidade, segurança, conformidade e rastreabilidade dos dados ao longo de todo o seu ciclo de vida. Durante o curso, os participantes aprenderão a implementar catálogos de dados, gestão de metadados, lineage, qualidade de dados e políticas de acesso utilizando ferramentas amplamente adotadas no mercado como Apache Atlas, Apache Ranger, Apache Kafka e Apache Hadoop. O curso também aborda governança em ambientes Data Lake, Data Warehouse e plataformas modernas de dados em cloud, permitindo que organizações implementem estratégias eficazes de gestão e proteção de dados.
Conteúdo Programatico
Module 1: Introduction to Data Governance
- Data Governance Concepts
- Importance of Data Governance
- Data Governance Frameworks
- Roles and Responsibilities in Data Governance
- Data Governance Maturity Models
Module 2: Data Governance Architecture
- Modern Data Governance Architecture
- Governance for Data Lakes and Data Warehouses
- Metadata Management Architecture
- Data Catalog Architecture
- Governance Integration with Data Platforms
Module 3: Metadata Management
- Metadata Concepts
- Technical Metadata
- Business Metadata
- Operational Metadata
- Metadata Lifecycle Management
Module 4: Data Catalogs and Discovery
- Data Catalog Architecture
- Data Asset Discovery
- Metadata Harvesting
- Data Classification
- Business Glossary Implementation
Module 5: Data Lineage and Traceability
- Data Lineage Concepts
- End-to-End Data Lineage
- Tracking Data Transformations
- Impact Analysis
- Data Lineage Visualization
Module 6: Data Quality Engineering
- Data Quality Dimensions
- Data Profiling
- Data Quality Monitoring
- Data Cleansing Strategies
- Data Validation Frameworks
Module 7: Data Security and Access Control
- Data Security Architecture
- Access Control Models
- Role-Based Access Control (RBAC)
- Attribute-Based Access Control (ABAC)
- Data Encryption and Protection
Module 8: Governance Tools and Platforms
- Overview of Apache Atlas
- Overview of Apache Ranger
- Policy Management
- Data Access Auditing
- Integrating Governance Tools with Data Platforms
Module 9: Governance for Streaming and Real-Time Data
- Data Governance for Streaming Architectures
- Event Data Governance
- Integrating Governance with Apache Kafka
- Real-Time Data Monitoring
- Compliance for Streaming Data
Module 10: Compliance and Regulatory Requirements
- Data Privacy Regulations
- Compliance Frameworks
- Data Protection Strategies
- Risk Management
- Governance Policies and Procedures
Module 11: Implementing Data Governance in Data Platforms
- Governance for Data Lakes
- Governance for Data Warehouses
- Governance in Cloud Data Platforms
- Integration with Data Pipelines
- Governance Automation
Module 12: Data Governance Best Practices
- Data Governance Implementation Strategy
- Organizational Adoption
- Governance Operating Models
- Continuous Improvement
- Real-World Governance Scenarios