Curso Designing a Data Warehouse
24 horasVisão Geral
Curso Designing a Data Warehouse: Há muitas considerações a serem feitas ao realizar o design de um data warehouse para dar suporte às suas soluções de Business Intelligence empresarial. Equipar sua equipe de design de data warehouse com as habilidades necessárias ajudará a garantir que você arquitete seu data warehouse para crescimento e escalabilidade futuros, além de atender a todas as suas necessidades de análise de dados por meio de um design robusto e desempenho ideal.
Este Curso Designing a Data Warehouse é voltado para designers, implementadores e gerentes de data warehouse e business intelligence, mas também servirá como uma boa base para analistas de negócios e dados que estarão envolvidos no trabalho com data warehouses e implantações de business intelligence.
Os participantes serão apresentados à terminologia básica e aos conceitos de uma arquitetura de Data Warehouse baseada em Kimball. O curso abrange Técnicas de Modelagem de Dimensões, introduzindo os conceitos básicos de Tabelas de Fatos, Tabelas de Dimensões, Hierarquias de Dimensões e muito mais.
Estudos de caso são usados para demonstrar os conceitos ensinados e para introduzir a necessidade de algumas das técnicas de modelagem mais avançadas, como tabelas sem fatos, arquitetura de barramento de data warehouse empresarial, tratamento de dimensões e instantâneos de mudança lenta, tabelas de ponte e hierarquias recursivas.
Objetivo
Após realizar este Curso Designing a Data Warehouse você será capaz de:
- Introdução ao Data Warehousing, Business Intelligence e Modelagem Dimensional
- Técnicas de modelagem dimensional de Kimball
- Tabelas de fatos transacionais, tabelas de fatos sem fatos
- Snapshot periódico e tabelas de fatos acumulativos
- Arquitetura de barramento empresarial e matriz
- Dimensões que mudam lentamente
- Dimensões de Role Play, Junk, Moeda e Auditoria
- Plano de Contas, Calendário e Dimensões de Hierarquia Recursiva
- Ciclo de vida do data warehouse, processos de modelagem e técnicas ETL/ELT
Publico Alvo
- Todos os indivíduos que estarão envolvidos em algum elemento do trabalho com um data warehouse se beneficiarão ao obter uma compreensão dos conceitos de modelagem de dimensão que influenciam o design final de um data warehouse.
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Introduction to Data Warehousing, Business Intelligence & Dimension Modelling
- Data Capture & Data Analysis
- Goals of Data Warehousing & BI
- Data Warehouses & Data Marts
- Kimball’s Data Warehouse/BI Architecture
- Alternative Data Warehouse/BI Architecture
- Star Schemas Versus OLAP Cubes
- OLAP Deployment Considerations
- Extract Transform Load (ETL)
- BI Applications
Kimball Dimensional Modelling Techniques
- Fundamental Concepts
- Four Step Design Process
- Basic Fact Tables
- Dimension Tables
- Calendar Dimensions
- Role Playing Dimensions
- Snowflake Dimensions
- Conformed Dimensions
- Slowly Changing Dimensions
- Dimension Hierarchies
- Advanced Fact Table Techniques
- Advanced Dimension Table Techniques
- Special Purpose Schemas
Dimensional Design Process - Transactional Data
- Retail Case Study
- Four Step Process for Designing Dimensional Models
- Nulls in dimensional model
- Snowflake Dimension Attributes
- Degenerate Dimensions
- Fact Table Granularity
- Transaction Fact Tables
- Factless Fact Tables
- Additive, Non-Additive and Derived Facts
- Dimension & Fact Table Keys
- Resisting Normalisation
Dimensional Design Process - Inventory Data
- Inventory Case Study
- Chain of Key Business Processes
- Semi-additive Facts
- Periodic Snapshots, Transaction, and Accumulating Snapshots
- Enterprise Data Warehouse Bus Architecture
- Enterprise Data Warehouse Bus Matrix
Dimensional Design Process - Changing Data
- Procurement Case Study
- Slowly Changing Dimensions
- Types 0 to 7 SCD Techniques
- Blended Versus Separate Transaction Schemas
Dimensional Design Process - Order Management
- Order Management Case Study
- Bus Matrix for Order Management Processes
- Fact Table Normalisation Considerations
- Role Playing Dimensions
- Factors to Determine Single or Multiple Dimensions
- Junk Dimensions
- More on Degenerate Dimensions
- Multiple Currencies
- Handling Facts with Different Granularities
- Audit Dimensions
- Accumulating Snapshot Schema
Dimensional Design Process - Financial Data
- Accounting Case Study
- Chart of Accounts
- Year to Date Facts
- Fiscal Calendars
- Drilling Down through Multi-ledger Hierarchy
- Consolidated Fact Tables
- Role of OLAP and Analytic Financial Solutions
Dimensional Design Process - HR Data
- Human Resources Case Study
- Employee Profile Tracking
- Headcount Periodic Snapshot
- Recursive Employee Hierarchies
Kimball Data Warehouse/BI Lifecycle
- Project Planning & Management
- Needs Analysis: Collecting Business Requirements
- Developing a Technical Architecture
- BI Application Design & Development: Dimensional Modelling, Physical Design
- Physical Storage
- ETL Design & Development
- Prototype
- Deployment, Maintenance & Growth
Dimensional Modelling Process & Tasks
- Preparation
- High Level Dimensional Model
- Detailed Dimensional Model Development
- Model Review & Validation
- Final Design Documentation: Description, Data Model Diagram, Detailed Dimension Design Worksheet
ETL Subsystems & Techniques
- Requirements & Constraints to be Considered: Business Needs, Compliance, Data Quality, Security, Integration, Latency, Archiving
- Data Profiling
- Extracting Data From Source Systems
- Cleansing and Conforming Source Data: Quality Screens, Error Events, Auditing, Deduplication
- Dimensional Structures to Monitor Quality Errors
- Deliver Data to Dimensional Structures
- Implement Slowly Changing Dimensions
- Manage Production ETL Environment: Reliability, Scheduling, Backup, Recovery & Restart, Version Control, Workflow Monitor, Lineage & Dependency, Problem Escalation, Security, Compliance
ETL System Design & Development Process
- Planning & Design: High Level Plan, Choose a Tool, Default Strategies, Documentation
- One Time Historic Data Load: Populate Dimension Tables, Load Fact Tables
- Incremental Load Processing
- Real Time Data Warehousing Considerations