Curso BigQuery Escalabilidade para Dados

  • DevOps | CI | CD | Kubernetes | Web3

Curso BigQuery Escalabilidade para Dados

24 horas
Visão Geral

O curso BigQuery Escalabilidade para Dados apresenta os fundamentos e práticas avançadas da plataforma Google BigQuery, demonstrando como ela permite processar grandes volumes de dados de maneira altamente escalável e eficiente. O participante aprenderá a projetar pipelines de dados, otimizar consultas SQL, integrar BigQuery com outras ferramentas do ecossistema Google Cloud e implementar soluções analíticas em larga escala com alta performance e baixo custo operacional.

Objetivo

Após realizar este curso BigQuery – Escalabilidade para Dados, você será capaz de:

  • Compreender a arquitetura escalável e serverless do Google BigQuery.
  • Criar, consultar e otimizar datasets e tabelas de grandes volumes de dados.
  • Implementar pipelines de ingestão e transformação de dados com alta eficiência.
  • Integrar BigQuery com outras soluções Google Cloud (Dataflow, Pub/Sub, Looker Studio).
  • Aplicar boas práticas de segurança, custo e desempenho em ambientes analíticos.
Publico Alvo
  • Engenheiros e arquitetos de dados.
  • Cientistas e analistas de dados que utilizam ou pretendem utilizar BigQuery.
  • Profissionais de BI e Analytics.
  • Desenvolvedores e administradores de sistemas que trabalham com Google Cloud Platform.
Pre-Requisitos
  • Conhecimentos básicos de SQL.
  • Noções sobre bancos de dados relacionais e data warehouses.
  • Familiaridade com conceitos de Big Data e Cloud Computing.
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico

Module 1: Introduction to Google BigQuery

  1. Overview of BigQuery and its serverless architecture
  2. Key features and use cases
  3. BigQuery ecosystem and integration with Google Cloud services
  4. Understanding the pricing model and storage options

Module 2: BigQuery Data Structures and Management

  1. Datasets, tables, and schemas
  2. Partitioning and clustering for performance
  3. Loading and exporting data (CSV, JSON, Avro, Parquet, ORC)
  4. Managing access control and permissions

Module 3: Querying and Performance Optimization

  1. Writing standard SQL queries in BigQuery
  2. Query execution plans and optimization techniques
  3. Materialized views and caching strategies
  4. Using temporary and external tables

Module 4: Data Ingestion and ETL Pipelines

  1. Integrating BigQuery with Cloud Storage, Pub/Sub, and Dataflow
  2. Streaming data ingestion and batch loading
  3. Building ETL workflows with Dataform and Composer
  4. Handling real-time analytics

Module 5: Analytics and Machine Learning in BigQuery

  1. BigQuery ML: training and evaluating models with SQL
  2. Building regression, classification, and forecasting models
  3. Using BigQuery for predictive analytics and anomaly detection
  4. Visualization with Looker Studio and Data Studio

Module 6: Monitoring, Cost Management, and Security

  1. Query performance monitoring and logging
  2. Cost estimation and optimization strategies
  3. Data encryption and audit logging
  4. Identity and Access Management (IAM) best practices

Module 7: Advanced Scenarios and Best Practices

  1. Managing multi-region datasets and replication
  2. Federated queries (Cloud SQL, Sheets, and external sources)
  3. Using APIs and client libraries for automation
  4. Real-world architectures and scalability case studies
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h