Curso Python Data Wrangling
24 horasVisão Geral
Neste Curso Python Data Wrangling , você aprenderá como usar Python para extrair/transformar dados de várias fontes, incluindo grandes cofres de banco de dados e tabelas financeiras do Excel.
Você também explorará insights sobre por que deve evitar métodos tradicionais de limpeza de dados, como feito em outras linguagens, e aproveitar as vantagens das funções especializadas do NumPy e do Pandas
O que é “disputa de dados”?
- A organização de dados consiste na ingestão, limpeza e unificação de fontes de dados brutos em um formato para análise mais acessível.
Objetivo
Após realizar este Curso Python Data Wrangling com êxito você será capaz de:
- Extraia e analise dados de várias fontes.
- Transforme e limpe dados usando Numpy e Pandas.
- Resuma e visualize dados com Matplotlib.
- Leia dados HTML , XML e JSON de recursos da Internet.
- Pesquise e filtre conjuntos de dados.
- Aplique ferramentas e técnicas Python para processar conjuntos de dados com eficiência.
- Continue aprendendo e enfrente novos desafios com treinamento individual de instrutor após o curso.
Publico Alvo
- Este Curso Python Data Wrangling, é para analistas e cientistas de dados que desejam utilizar Python para extrair de várias fontes e prepará-lo para modelagem de aprendizado de máquina.
Pre-Requisitos
- Você deve conhecer os fundamentos do Python, incluindo estruturas de dados, importação e uso de módulos, criação de funções e uso da plataforma Jupyter Notebook.
Materiais
Curso Python Data WranglingConteúdo Programatico
Introduction to Data Structure Using Python
In this module, you will learn about the following:
- Python for Data Wrangling
- Lists, Sets, Strings, Tuples, and Dictionaries
Advanced Operations on Built-In Data Structure
In this module, you will learn about the following:
- Advanced Data Structures
- Basic File Operations in Python
Introduction to NumPy, Pandas, and Matplotlib
In this module, you will learn about the following:
- NumPy Arrays
- Pandas DataFrames
- Statistics and Visualization with NumPy and Pandas
- Using NumPy and Pandas to Calculate Basic Descriptive Statistics on the DataFrame
Deep Dive into Data Wrangling with Python
In this module, you will learn about the following:
- Subsetting, Filtering, and Grouping
- Detecting Outliers and Handling Missing Values
- Concatenating, Merging, and Joining
- Useful Methods of Pandas
Getting Comfortable with Different Data Sources
In this module, you will learn about the following:
- Reading Data from Different Text-Based (and Non-Text-Based) Sources
- Introduction to BeautifulSoup4 and Web Page Parsing
Learning the Hidden Secrets of Data Wrangling
In this module, you will learn about the following:
- Advanced List Comprehension and the zip function
- Data Formatting
Advanced Web Scraping and Data Gathering
In this module, you will learn about the following:
- Basics of Web Scraping and BeautifulSoup libraries
- Reading Data from XML
RDBMS and SQL
In this module, you will learn about the following:
- Refresher of RDBMS and SQL
- Using an RDBMS (MySQL/PostgreSQL/SQLite)
Application in Real Life and Conclusion of Course
In this module, you will learn about the following:
- Applying Your Knowledge to a Real-life Data Wrangling Task
- An Extension to Data Wrangling