Visão Geral
Curso Python Tools for Data Analysis and Visualization: Por meio de uma série de exercícios práticos, os alunos aprenderão a transformar dados em informações acionáveis. O mundo está se afogando em dados. A cada dia, 2,5 Exabytes de dados (250 novas Bibliotecas de Congressos construídas ou 90 anos de vídeo HD) são produzidos. O problema é colocar os dados em um formato que possa ser usado por ferramentas que ajudem a entender e verificar os dados. A programação em Python é relativamente rápida de aprender e tem um ótimo conjunto de ferramentas para importar, transformar, explorar, extrair insights, fazer previsões com e exportar os dados. Este curso apresenta as principais ferramentas Python usadas para preparar os dados para análise, as ferramentas disponíveis para entender os dados e usar os dados para insights e previsões. Todos os trabalhos de classe e exercícios são feitos em Python 3.x.
Objetivo
- Aprenda a usar os notebooks Jupyter
- Aprenda a trabalhar com tipos de dados NumPy
- Seja proficiente em pandas Series
- Seja proficiente em DataFrames do Pandas
- Entenda como usar a visualização de dados
- Saiba como importar e limpar dados
- Apresentar ferramentas estatísticas para trabalhar com conjuntos de dados
- Uma introdução aos problemas de trabalhar com fontes de dados PDF
- Apresentar ferramentas de aprendizado de máquina para trabalhar com conjuntos de dados
- Trabalhe em uma análise completa de dados para entender como as ferramentas interagem entre si
Pre-Requisitos
- Conhecimento básico de Python.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Advanced Python Review
- A Python Development Environment
- A Review of Data type
- The New Class Structure
- Python Best Practices
Ipython Notebook
- Functionality Provided – Why Use Them?
- CRUD for Notebooks
- Interface and Shortcuts
NumPy
- Datatypes
- Universal Functions
- Indexing
- Summary Methods
- Sorting
- Computations and Broadcasting
SciPy
- Overview of SciPy
- Statistical Functions
Panda: Series
- Pandas Series Structure
- Series CRUD
- Indexing and Access Techniques
- Data Methods
Pandas: DataFrame Basics
- DataFrame Construction
- DataFrame Change and Reorganization
- Indexing and Access Techniques
- Grouping, Pivoting, and Reshaping
- DataFrame CRUD
Pandas DataFrame: Data Manipulation
- Statistics
- Data Methods
- Missing Data Tools
Understanding Data Visualization
- Visualization Is Storytelling
- Types of Charts
- Colors Yes and No
- Common Mistakes
- Best Practices
- Reproducibility
Matplotlib for Data Visualization
- Steps for Creating a Data Visualization
- Jupyter Notebooks and Matplotlib
- Matplotlib Styles
- Small Multiples
- Panda Series Plotting
- Panda Dataframe Plotting
Advanced Techniques
- Seaborn
- Bokeh
Data Cleaning
- Importing Data: csv, xml, html, xls
- Problems of PDF Data Sources
- Transformations Data
- Missing Data
- Time Series Problems
- Automation of Process
Statistics for Understanding Data
- Exploratory Data Analysis Tools: PMF, CDF, Correlation, Least Squares
- A/B Testing
- Hypothesis Test
- Statistical Significance, P-Values, and Confidence Intervals
- Z- and T- Statistics
Approach to Understanding Data
- Overview of Approach
- Great Data Sources
- Class Demonstration on Data Set
- Team Project: Working a Project
Introduction to Statistical Techniques
- Regression and Prediction
- Classification
- K-Nearest Neighbors
- Tree Models
- Clustering
Introduction to Machine Learning
- Regression and Prediction
- Classification
- K-Nearest Neighbors
- Clustering
- Neural Networks
- Deep Learning
TENHO INTERESSE