Curso AWS Data Processing and Analysis

  • DevOps | CI | CD | Kubernetes | Web3

Curso AWS Data Processing and Analysis

24 horas
Visão Geral

O curso AWS Data Processing and Analysis apresenta as principais ferramentas e serviços da AWS voltados para o processamento, transformação e análise de dados. Durante o treinamento, os participantes aprenderão a projetar pipelines de dados, usar serviços como AWS Glue, AWS Lambda, Amazon Kinesis e Amazon Athena, e implementar soluções escaláveis de análise com base em boas práticas da AWS.

Objetivo

Após realizar este Curso AWS Data Processing and Analysis, você será capaz de:

  1. Compreender os principais serviços de processamento e análise de dados na AWS.
  2. Construir pipelines de dados automatizados e escaláveis.
  3. Aplicar ETL (Extract, Transform, Load) usando AWS Glue e Lambda.
  4. Analisar grandes volumes de dados com Amazon Athena e Redshift.
  5. Integrar dados em tempo real com Amazon Kinesis.
Publico Alvo
  •  
  • Engenheiros e analistas de dados que desejam processar e analisar grandes volumes de dados na nuvem.
  • Desenvolvedores que utilizam serviços AWS para construir pipelines de dados.
  • Profissionais de TI que buscam aprimorar o uso de ferramentas de análise e integração de dados na AWS.
  •  
Pre-Requisitos
  •  
  • Conhecimento básico de computação em nuvem e serviços AWS.
  • Noções de bancos de dados e linguagens de consulta (SQL).
  • Familiaridade com Python é recomendada.
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Introduction to AWS Data Analytics

  1. Overview of AWS Data Analytics ecosystem
  2. Key concepts: ETL, Data Lakes, and Data Warehousing
  3. Understanding data processing and analysis workflows

Module 2: Data Ingestion and Storage

  1. Amazon S3 for data storage and organization
  2. Ingesting data from multiple sources
  3. Managing data formats (CSV, JSON, Parquet, ORC)

Module 3: Data Processing with AWS Glue

  1. Introduction to AWS Glue components
  2. Building and running ETL jobs
  3. Data Catalog, Crawlers, and Job Triggers
  4. Integration with Amazon S3 and Redshift

Module 4: Stream Processing with Amazon Kinesis

  1. Overview of Kinesis Data Streams and Kinesis Data Firehose
  2. Real-time data ingestion and transformation
  3. Use cases for streaming analytics

Module 5: Serverless Data Processing

  1. Using AWS Lambda for event-driven processing
  2. Integrating Lambda with S3, DynamoDB, and Kinesis
  3. Error handling and retries in serverless architectures

Module 6: Data Analysis with Amazon Athena

  1. Querying data directly in Amazon S3 using SQL
  2. Optimizing queries and partitions
  3. Integrating Athena with Glue Data Catalog

Module 7: Data Warehousing with Amazon Redshift

  1. Overview of Redshift architecture
  2. Loading and querying data efficiently
  3. Redshift Spectrum and data lake integration

Module 8: Visualization and Reporting

  1. Integrating AWS services with Amazon QuickSight
  2. Creating dashboards and interactive reports
  3. Sharing insights securely within organizations

Module 9: Security, Monitoring, and Best Practices

  1. Data encryption and IAM permissions
  2. Monitoring with AWS CloudWatch and CloudTrail
  3. Cost optimization and performance tuning
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h