Curso Python for Data Science Advanced

  • RPA | IA | AGI | ASI | ANI | IoT | PYTHON | DEEP LEARNING

Curso Python for Data Science Advanced

24 horas
Visão Geral

Curso Python for Data Science Advanced. Aprenda habilidades avançadas em Python para análise de dados, visualizações e processamento de big data.

Este curso explora o uso de Python para cientistas de dados realizarem análises exploratórias de dados, visualizações complexas e processamento distribuído em grande escala usando Big Data. Neste Curso Python for Data Science Advanced, você aprenderá sobre bibliotecas matemáticas e estatísticas essenciais, como NumPy, Pandas, SciPy, SciKit-Learn, junto com estruturas como TensorFlow e Spark. Também cobre ferramentas de visualização como matplotlib, PIL e Seaborn.

Objetivo

Após realizare este Curso Python for Data Science Advanced, você será capaz de:

  • Como trabalhar com Python em um contexto de ciência de dados
  • Como usar NumPy, Pandas e MatPlotLib
  • Como criar e processar imagens com PIL
  • Como visualizar com Seaborn
  • Principais recursos do SciPy e SciKit Learn
  • Como interagir com Spark usando DataFrames
  • Como usar streaming SparkSQL, MLlib e Big Data
Publico Alvo

Cientistas de dados, engenheiros de dados e engenheiros de software com experiência em Python básico e ciência de dados.

Pre-Requisitos
  • Python para ciência de dados Primer
  • JumpStart para Python para ciência de dados
  • Python aplicado para ciência e engenharia de dados
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Python Review

  1. Python Language
  2. Essential Syntax
  3. Lists, Sets, Dictionaries, and Comprehensions
  4. Functions
  5. Classes, Modules, and imports
  6. Exceptions

iPython

  1. iPython basics
  2. Terminal and GUI shells
  3. Creating and using notebooks
  4. Saving and loading notebooks
  5. Ad hoc data visualization
  6. Web Notebooks (Jupyter)

NumPy

  1. NumPy basics
  2. Creating arrays
  3. Indexing and slicing
  4. Large number sets
  5. Transforming data
  6. Advanced tricks

SciPy

  1. What can SciPy do?
  2. Most useful functions
  3. Curve fitting
  4. Modeling
  5. Data visualization
  6. Statistics

SciPy subpackages

  1. Clustering
  2. Physical and mathematical Constants
  3. FFTs
  4. Integral and differential solvers
  5. Interpolation and smoothing
  6. Input and Output
  7. Linear Algebra
  8. Image Processing
  9. Distance Regression
  10. Root-finding
  11. Signal Processing
  12. Sparse Matrices
  13. Spatial data and algorithms
  14. Statistical distributions and functions
  15. C/C++ Integration

pandas

  1. pandas overview
  2. Dataframes
  3. Reading and writing data
  4. Data alignment and reshaping
  5. Fancy indexing and slicing
  6. Merging and joining data sets

matplotlib

  1. Creating a basic plot
  2. Commonly used plots
  3. Ad hoc data visualization
  4. Advanced usage
  5. Exporting images

The Python Imaging Library (PIL)

  1. PIL overview
  2. Core image library
  3. Image processing
  4. Displaying images

seaborn

  1. Seaborn overview
  2. Bivariate and univariate plots
  3. Visualizing Linear Regressions
  4. Visualizing Data Matrices
  5. Working with Time Series data

SciKit-Learn Machine Learning Essentials

  1. SciKit overview
  2. SciKit-Learn overview
  3. Algorithms Overview
  4. Classification, Regression, Clustering, and Dimensionality Reduction
  5. SciKit Demo

TensorFlow Overview

  1. TensorFlow overview
  2. Keras
  3. Getting Started with TensorFlow

PySpark Overview

  1. Python and Spark
  2. SciKit-Learn vs. Spark MLlib
  3. Python at Scale
  4. PySpark Demo

RDDs and DataFrames

  1. DataFrames and Resilient Distributed Datasets (RDDs)
  2. Partitions
  3. Adding variables to a DataFrame
  4. DataFrame Types
  5. DataFrame Operations
  6. Dependent vs. Independent variables
  7. Map/Reduce with DataFrames

Spark SQL

  1. Spark SQL Overview
  2. Data stores: HDFS, Cassandra, HBase, Hive, and S3
  3. Table Definitions
  4. Queries

Spark MLib

  1. MLib overview
  2. MLib Algorithms Overview
  3. Classification Algorithms
  4. Regression Algorithms
  5. Decision Trees and forests
  6. Recommendation with ALS
  7. Clustering Algorithms
  8. Machine Learning Pipelines
  9. Linear Algebra (SVD, PCA)
  10. Statistics in MLib

Spark Streaming

  1. Streaming overview
  2. Integrating Spark SQL, MLlib, and Streaming
TENHO INTERESSE

Cursos Relacionados

Curso AI ML Toolkits with Kubeflow Foundation

24 horas

Curso Container Management with Docker

24 Horas

Curso Machine Learning Python & R In Data Science

32 Horas

Curso Docker for Developers and System Administrators

16 horas

Curso artificial inteligence AI for Everyone Foundation

16 horas

Curso IA Inteligência Artificial e Código Aberto Foundation

16 horas

Curso Artificial Intelligence with Azure

24 Horas

Curso RPA Robotic Process Automation Industria 4.0

32 horas