Curso Exploratory Data Analysis in AWS

  • DevOps | CI | CD | Kubernetes | Web3

Curso Exploratory Data Analysis in AWS

20 horas
Visão Geral

O curso Exploratory Data Analysis in AWS ensina como realizar análises exploratórias de dados (EDA) utilizando os principais serviços e ferramentas da AWS. O participante aprenderá a coletar, limpar, transformar e visualizar dados para gerar insights iniciais que auxiliam na modelagem preditiva e na tomada de decisões baseadas em dados.

Objetivo

Após realizar este curso Exploratory Data Analysis in AWS, você será capaz de:

  • Executar análises exploratórias de dados em ambientes AWS.
  • Utilizar serviços como S3, Athena, Glue e SageMaker para preparar e explorar dados.
  • Visualizar padrões e distribuições de dados para identificar insights iniciais.
  • Integrar notebooks interativos e ferramentas analíticas com fontes de dados na nuvem.
Publico Alvo
  •  
  • Analistas e engenheiros de dados que desejam explorar e entender conjuntos de dados na nuvem AWS.
  • Cientistas de dados em fase inicial que buscam aplicar técnicas de EDA com ferramentas AWS.
  • Profissionais de BI e desenvolvedores interessados em análise e visualização de dados na AWS.
  •  
Pre-Requisitos
  •  
  • Conhecimento básico de AWS e SQL.
  • Noções de estatística descritiva e manipulação de dados.
  • Familiaridade com Python ou ferramentas de análise de dados.
  •  
Materiais
Ingles/Portugues
Conteúdo Programatico

Module 1: Introduction to Exploratory Data Analysis (EDA)

  1. Understanding the importance of EDA
  2. Common techniques and objectives of EDA
  3. AWS services for data exploration and visualization

Module 2: Data Collection and Storage

  1. Storing and organizing data in Amazon S3
  2. Managing data formats (CSV, Parquet, JSON)
  3. Using AWS Glue Data Catalog for metadata management

Module 3: Data Preparation and Cleaning

  1. Data extraction and transformation with AWS Glue
  2. Handling missing values and duplicates
  3. Formatting and structuring data for analysis

Module 4: Querying and Exploration with Amazon Athena

  1. Running SQL queries on data stored in S3
  2. Creating tables and partitions
  3. Aggregations, filtering, and statistical summaries

Module 5: Exploratory Analysis with Amazon SageMaker Studio

  1. Introduction to SageMaker Notebooks
  2. Data exploration with Pandas and Matplotlib
  3. Statistical and correlation analysis

Module 6: Visualization and Insight Generation

  1. Visualizing data with Amazon QuickSight
  2. Building interactive dashboards
  3. Interpreting patterns and anomalies

Module 7: Automating EDA Workflows

  1. Integrating EDA with AWS Lambda and Step Functions
  2. Using event-driven workflows for data updates
  3. Automating summary reports and dashboards

Module 8: Best Practices and Cost Optimization

  1. Efficient data query and storage practices
  2. Security, access control, and IAM roles
  3. Managing costs during EDA processes
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h