Visão Geral
O curso Python for Data Analysis with Pandas and NumPy oferece uma base sólida para profissionais que desejam trabalhar com análise e manipulação de dados utilizando Python. Por meio das bibliotecas NumPy e Pandas, os participantes aprenderão a realizar operações eficientes em grandes volumes de dados, limpeza, transformação, agregação e análise exploratória, preparando informações para relatórios e modelos de machine learning.
Objetivo
Após realizar este curso Python for Data Analysis with Pandas and NumPy, você será capaz de:
- Manipular e analisar dados com eficiência usando Pandas e NumPy
- Trabalhar com estruturas de dados como Series e DataFrames
- Executar transformações e agregações complexas de dados
- Tratar dados ausentes, duplicados e inconsistentes
- Preparar dados para análise estatística e machine learning
Publico Alvo
- Cientistas de dados iniciantes, analistas, desenvolvedores e estudantes que desejam dominar ferramentas de análise de dados com Python de forma prática e aplicada.
Pre-Requisitos
- Conhecimento básico de Python
- Noções de estatística e álgebra linear (desejável)
- Familiaridade com Jupyter Notebook
Materiais
Inglês/Português + Exercícios + Lab Pratico
Conteúdo Programatico
Introduction to Data Analysis with Python
- Importance of data analysis in business and science
- Overview of Pandas and NumPy
- Setting up the environment (Anaconda, Jupyter Notebook)
NumPy Fundamentals
- Creating and manipulating NumPy arrays
- Array indexing, slicing, and reshaping
- Vectorized operations and broadcasting
- Mathematical and statistical functions in NumPy
Working with Random Data and Simulations
- Random number generation and sampling
- Simulating data for analysis
- Using NumPy for numerical computations
Introduction to Pandas
- Understanding Series and DataFrames
- Creating DataFrames from different sources (CSV, Excel, JSON, SQL)
- Indexing, selecting, and filtering data
Data Cleaning and Preparation
- Handling missing and duplicate data
- Data type conversion and renaming columns
- String operations and applying custom functions
Data Transformation and Aggregation
- Sorting, grouping, and aggregating data
- Pivot tables and cross-tabulations
- Merging and joining multiple DataFrames
Exploratory Data Analysis (EDA)
- Descriptive statistics and correlations
- Outlier detection and data visualization with Pandas
- Identifying data trends and anomalies
Working with Time Series Data
- Parsing and manipulating dates
- Resampling and frequency conversion
- Rolling statistics and time-based indexing
Input/Output Operations
- Reading and writing CSV, Excel, JSON, and SQL databases
- Working with APIs and external data sources
- Managing large datasets efficiently
Performance Optimization
- Vectorization and avoiding loops
- Memory usage optimization
- Profiling and benchmarking code
Integrating Pandas, NumPy, and Visualization Libraries
- Using Matplotlib and Seaborn for visual analytics
- Combining numeric and visual analysis
- Case study: From raw data to insights
Final Project
- Full end-to-end data analysis project using Pandas and NumPy
- Data cleaning, transformation, visualization, and reporting
TENHO INTERESSE