Curso Jumpstart to Python For Data Science

  • DevOps | CI | CD | Kubernetes | Web3

Curso Jumpstart to Python For Data Science

24 horas
Visão Geral

Curso Jumpstart to Python For Data Science. Aprenda a resolver problemas básicos de ciência de dados usando Python.

A ciência de dados é um novo domínio de conhecimento em rápido crescimento, usado pelas organizações para tomar decisões baseadas em dados. Os cientistas de dados desempenham várias funções para trabalhar com dados e obter valor deles. A linguagem de programação Python é uma ferramenta indispensável para o profissional de ciência de dados e uma ferramenta obrigatória para todo aspirante a cientista de dados. Python oferece um ambiente rápido, confiável, multiplataforma e maduro para análise de dados, aprendizado de máquina e resolução de problemas algorítmicos.

Começando com os fundamentos do Python na ciência de dados, você aprenderá a gerenciar dados e realizar álgebra linear em Python. Você aplicará técnicas de regressão logística aos seus aplicativos antes de criar mecanismos de recomendação com vários algoritmos de filtragem colaborativa e melhorar suas previsões aplicando os métodos de conjunto. Por fim, você realizará clustering K-means, juntamente com uma análise de dados não estruturados com diferentes técnicas de mineração de texto e aproveitando o poder do Python na análise de big data.

 

Objetivo

Após realizare este Curso Jumpstart to Python For Data Science você será capaz de:

  • Gerencie dados e execute álgebra linear em Python
  • Derive inferências da análise realizando estatísticas inferenciais
  • Resolva problemas de ciência de dados em Python
  • Crie visualizações de alta qualidade usando Python
  • Avaliar e aplicar a técnica de regressão linear para estimar as relações entre variáveis
  • Crie mecanismos de recomendação com vários algoritmos de filtragem colaborativa
  • Aplique os métodos de conjunto para melhorar suas previsões
  • Trabalhe com tecnologias de big data para lidar com dados em escala

 

Pre-Requisitos
  • Scripts Python escritos
  • Sinta-se confortável trabalhando com arquivos, pastas e linha de comando
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Getting Started with Raw Data

  1. The world of arrays with NumPy
  2. Empowering data analysis with pandas
  3. Data cleansing
  4. Data operations

Inferential Statistics

  1. Various forms of distribution
  2. A z-score
  3. A p-value
  4. One-tailed and two-tailed tests
  5. Type 1 and Type 2 errors
  6. A confidence interval
  7. Correlation
  8. Z-test vs T-test
  9. The F distribution
  10. The chi-square distribution
  11. The chi-square test of independence
  12. ANOVA

Finding a Needle in a Haystack

  1. What is data mining?
  2. Presenting an analysis

Making Sense of Data through Advanced Visualization

  1. Controlling the line properties of a chart
  2. Creating multiple plots
  3. Playing with text
  4. Styling your plots
  5. Box plots
  6. Heatmaps
  7. Scatter plots with histograms
  8. A scatter plot matrix
  9. Area plots
  10. Bubble charts
  11. Hexagon bin plots
  12. Trellis plots
  13. A 3D plot of a surface

Uncovering Machine Learning

  1. Different types of machine learning
  2. Decision trees
  3. Linear regression
  4. Logistic regression
  5. The naive Bayes classifier
  6. The k-means clustering
  7. Hierarchical clustering

Performing Predictions with a Linear Regression

  1. Simple linear regression
  2. Multiple regression
  3. Training and testing a model

Estimating the Likelihood of Events

  1. Logistic regression

Generating Recommendations with Collaborative Filtering

  1. Recommendation data
  2. User-based collaborative filtering
  3. Item-based collaborative filtering

Pushing Boundaries with Ensemble Models

  1. The census income dataset
  2. Decision trees
  3. Random forests
  4. Applying Segmentation with k-means Clustering
  5. The k-means algorithm and its working
  6. The k-means clustering with countries
  7. Clustering the countries

Analyzing Unstructured Data with Text Mining

  1. Preprocessing data
  2. Creating a wordcloud
  3. Word and sentence tokenization
  4. Parts of speech tagging
  5. Stemming and lemmatization
  6. The Stanford Named Entity Recognizer
  7. Performing sentiment analysis on world leaders using Twitter

Leveraging Python in the World of Big Data

  1. What is Hadoop?
  2. Python MapReduce
  3. File handling with Hadoopy
  4. Pig
  5. Python with Apache Spark
TENHO INTERESSE

Cursos Relacionados

Curso Ansible Red Hat Basics Automation Technical Foundation

16 horas

Curso Terraform Deploying to Oracle Cloud Infrastructure

24 Horas

Curso Ansible Linux Automation with Ansible

24 horas

Ansible Overview of Ansible architecture

16h

Advanced Automation: Ansible Best Practices

32h