Curso Python Tools for Data Analysis and Visualization

  • DevOps | CI | CD | Kubernetes | Web3

Curso Python Tools for Data Analysis and Visualization

32 horas
Visão Geral

Curso Python Tools for Data Analysis and Visualization: Por meio de uma série de exercícios práticos, os alunos aprenderão a transformar dados em informações acionáveis. O mundo está se afogando em dados. A cada dia, 2,5 Exabytes de dados (250 novas Bibliotecas de Congressos construídas ou 90 anos de vídeo HD) são produzidos. O problema é colocar os dados em um formato que possa ser usado por ferramentas que ajudem a entender e verificar os dados. A programação em Python é relativamente rápida de aprender e tem um ótimo conjunto de ferramentas para importar, transformar, explorar, extrair insights, fazer previsões com e exportar os dados. Este curso apresenta as principais ferramentas Python usadas para preparar os dados para análise, as ferramentas disponíveis para entender os dados e usar os dados para insights e previsões. Todos os trabalhos de classe e exercícios são feitos em Python 3.x.

Objetivo
  • Aprenda a usar os notebooks Jupyter
  • Aprenda a trabalhar com tipos de dados NumPy
  • Seja proficiente em pandas Series
  • Seja proficiente em DataFrames do Pandas
  • Entenda como usar a visualização de dados
  • Saiba como importar e limpar dados
  • Apresentar ferramentas estatísticas para trabalhar com conjuntos de dados
  • Uma introdução aos problemas de trabalhar com fontes de dados PDF
  • Apresentar ferramentas de aprendizado de máquina para trabalhar com conjuntos de dados
  • Trabalhe em uma análise completa de dados para entender como as ferramentas interagem entre si
Pre-Requisitos
  • Conhecimento básico de Python.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Advanced Python Review

  1. A Python Development Environment
  2. A Review of Data type
  3. The New Class Structure
  4. Python Best Practices

Ipython Notebook

  1. Functionality Provided – Why Use Them?
  2. CRUD for Notebooks
  3. Interface and Shortcuts

NumPy

  1. Datatypes
  2. Universal Functions
  3. Indexing
  4. Summary Methods
  5. Sorting
  6. Computations and Broadcasting

SciPy

  1. Overview of SciPy
  2. Statistical Functions

Panda: Series

  1. Pandas Series Structure
  2. Series CRUD
  3. Indexing and Access Techniques
  4. Data Methods

Pandas: DataFrame Basics

  1. DataFrame Construction
  2. DataFrame Change and Reorganization
  3. Indexing and Access Techniques
  4. Grouping, Pivoting, and Reshaping
  5. DataFrame CRUD

Pandas DataFrame: Data Manipulation

  1. Statistics
  2. Data Methods
  3. Missing Data Tools

Understanding Data Visualization

  1. Visualization Is Storytelling
  2. Types of Charts
  3. Colors Yes and No
  4. Common Mistakes
  5. Best Practices
  6. Reproducibility

Matplotlib for Data Visualization

  1. Steps for Creating a Data Visualization
  2. Jupyter Notebooks and Matplotlib
  3. Matplotlib Styles
  4. Small Multiples
  5. Panda Series Plotting
  6. Panda Dataframe Plotting

Advanced Techniques

  1. Seaborn
  2. Bokeh

Data Cleaning

  1. Importing Data: csv, xml, html, xls
  2. Problems of PDF Data Sources
  3. Transformations Data
  4. Missing Data
  5. Time Series Problems
  6. Automation of Process

Statistics for Understanding Data

  1. Exploratory Data Analysis Tools: PMF, CDF, Correlation, Least Squares
  2. A/B Testing
  3. Hypothesis Test
  4. Statistical Significance, P-Values, and Confidence Intervals
  5. Z- and T- Statistics

Approach to Understanding Data

  1. Overview of Approach
  2. Great Data Sources
  3. Class Demonstration on Data Set
  4. Team Project: Working a Project

Introduction to Statistical Techniques

  1. Regression and Prediction
  2. Classification
  3. K-Nearest Neighbors
  4. Tree Models
  5. Clustering

Introduction to Machine Learning

  1. Regression and Prediction
  2. Classification
  3. K-Nearest Neighbors
  4. Clustering
  5. Neural Networks
  6. Deep Learning
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h