Curso Statistics Foundations

  • Tableau Data Visualization

Curso Statistics Foundations

16 horas
Visão Geral

Se você acha que as estatísticas não têm nada a dizer sobre o que você faz, ou como você poderia fazer melhor, então você está errado ou precisa de um trabalho mais interessante.

- Stephen Senn

A estatística é a ciência da ciência de dados. Sem ele, sua tomada de decisão "orientada por dados" pode estar levando você para a beira do precipício. Uma compreensão sólida de raciocínio estatístico garante que você extraia apenas percepções válidas de seus dados.

Muitas armadilhas aguardam o explorador de dados incauto. Neste curso, você aprenderá como evitar erros embaraçosos que podem prejudicar meses de trabalho.

Você ganhará experiência prática com as ferramentas necessárias para entender seus dados e tirar as conclusões corretas. O foco está no pensamento estatístico. Os conceitos serão introduzidos intuitivamente antes de serem expandidos formalmente. Você aprenderá como pensar em termos de distribuições - não estimativas de um único ponto. Os métodos estatísticos serão introduzidos no contexto de como usá-los para obter insights e resolver problemas. Como bônus, você também terá a chance de usar o poderoso ambiente R padrão da indústria para fazer cálculos numéricos.

Introdução à Estatística é um curso essencial para qualquer pessoa técnica, gerencial ou administrativa - interessada em usar dados para informar sua tomada de decisão. Existem pacotes de certificação disponíveis com este treinamento.

Objetivo

Após realizar este curso você será capaz de:

  • Visualize os dados
  • Tire conclusões sobre os recursos e a qualidade dos conjuntos de dados
  • Resuma seus dados
  • Determinar correlação
  • Pense nos números como distribuições
  • Compreenda a amostragem e sua importância na inferência estatística
  • Use o poder dos computadores para gerar distribuições para qualquer problema
  • Calcular intervalos de confiança e valores p
  • Faça inferências estatísticas válidas usando uma variedade de testes de hipótese
  • Análise estatística crítica
  • Projete e execute seus próprios projetos estatísticos
Publico Alvo
  • Qualquer pessoa que tire conclusões a partir de números.
  • Nenhum conhecimento prévio de estatísticas ou pacotes de software é necessário. Uma natureza curiosa e interesse em usar números para resolver problemas são essenciais.
Pre-Requisitos
  • Os participantes devem ser capazes de compreender conceitos matemáticos básicos (nível de ensino médio) e ter um nível de conforto com o uso de softwares de computador, como o Excel.
Materiais
Português/Inglês
Conteúdo Programatico

Introduction and Overview

  1. Course philosophy
  2. Software
  3. Contents

What is Statistics?

  1. Definition
  2. Types of statistician
  3. Variability
  4. Probability
  5. Let the die roll!
  6. Die roll outcomes
  7. Why is knowledge of statistics important?
  8. Descriptive vs inferential statistics
  9. Inferring population parameters
  10. Quantitative data
  11. Qualitative data
  12. R statistical software
  13. RStudio
  14. Interactive exercise manual demo

Exploratory Data Analysis

  1. What is exploratory data analysis (EDA)
  2. Histograms and bar charts
  3. Bar chart vs histogram
  4. Central tendency and spread
  5. Bin width is crucial
  6. Right-skewed data
  7. Outliers
  8. Left-skewed data
  9. Bimodal data
  10. Separate subpopulations for analysis
  11. Individual value plot
  12. Subpopulation individual value plots
  13. Benefits of boxplots
  14. Boxplot
  15. Boxplot vs histogram
  16. Left-skewed boxplot
  17. Compare subpopulations using boxplots
  18. Swedish salaries by level of education
  19. Measures of central tendency
  20. Mean vs median
  21. Mean vs median for skewed data
  22. Mode
  23. Measures of spread
  24. Range and IQR
  25. Standard deviation
  26. Six figure summary
  27. Central tendency and spread equations
  28. Quantiles
  29. Benefits of scatterplots
  30. Scatterplot
  31. Highlighting subgroups on scatterplot
  32. What is correlation?
  33. Correlation examples
  34. Random data correlation
  35. Literacy rate correlation
  36. # children per woman correlation
  37. Interpreting correlation coefficients
  38. Correlation doesn’t imply causation
  39. Causation doesn’t imply (linear) correlation
  40. Probability Distributions
  41. Numbers are mostly reckless estimates
  42. Random variables
  43. Male life expectancy in UK distribution
  44. What’s the probability that a US man is 6’ or more?
  45. What is a probability distribution?
  46. Populations vs samples
  47. Sampling the heights of 10 random American men
  48. Sampling the heights of 100,000 random American men
  49. Discrete probability distributions
  50. Roll two dice and histogram the results
  51. Poisson distribution
  52. Binary probability distributions
  53. Probability distribution for cars/household in the UK
  54. Binomial distribution
  55. Geometric distribution
  56. Negative Binomial distribution
  57. Continuous probability distributions
  58. Uniform distribution
  59. Triangular distribution
  60. Normal distribution
  61. Properties of the normal distribution
  62. Distribution of IQ scores
  63. Different means (same standard deviation)
  64. Different standard deviations (same mean)
  65. z-distribution
  66. 68–95–99.7 (empirical) rule
  67. Quantile-Quantile (Q-Q) plot
  68. Q-Q plot of non-normal data
  69. Common probability distributions “family tree”

Sampling

  1. Samples are proxies for the population of interest
  2. Unfortunately, samples vary
  3. Larger samples exhibition less variation
  4. Statistics vs parameters
  5. Distributions involved in statistical inference
  6. Sampling distribution of mean IQ
  7. Collecting more IQ samples
  8. Sampling distribution of mean die roll
  9. Sampling distribution of mean project duration
  10. Create a sampling distribution
  11. Central limit theorem
  12. Implications of the central limit theorem
  13. Standard error of the mean (SEM)
  14. Impact of sample size on SEM
  15. What is a confidence interval?
  16. 95% confidence interval
  17. Bigger samples give greater precision
  18. Smaller confidence levels result in tighter intervals
  19. How should we interpret the confidence interval?
  20. Random sampling
  21. Simple random sampling
  22. Stratified sampling
  23. Cluster sampling
  24. What is bootstrapping?
  25. Estimating median life expectancy

Statistical Inference

  1. What is statistical inference?
  2. Why must we use samples?
  3. Why do we need to conduct hypothesis tests?
  4. What is hypothesis testing?
  5. Null hypothesis
  6. Alternative hypothesis
  7. Rejecting the null hypothesis
  8. One- vs Two-tailed hypothesis tests
  9. Choosing between one- and two-tailed tests
  10. What are p-values?
  11. Significance level (?)
  12. Types of errors
  13. Confidence levels vs significance levels
  14. Performing hypothesis tests
  15. p-value controversy
  16. When to use a t-test
  17. t-value
  18. t-distribution
  19. t-distributions
  20. Slot machine observed ”Return to Player”
  21. Are slot machine payouts within tolerance?
  22. Preform a t-test on RTP data using R
  23. Two-sample t-test
  24. When to use a z-test
  25. Conducting hypothesis tests using z-scores
  26. When to use a 2 test
  27. Education and Brexit vote
  28. Brexit vote breakdown
  29. 2 value
  30. 2 distributions
  31. Are education and Brexit vote related?
  32. When to use a F-test
  33. Conducting hypothesis tests using F-values
  34. F-distributions
  35. Height distribution by sex
  36. Does height variation differ by sex?
  37. When to use analysis of variance (ANOVA)
  38. Determining the F-value
  39. Are all diets the same?
  40. All diets are apparently not the same
  41. Normality hypothesis tests
  42. Statistically significant treatments?
  43. What is statistical power?
  44. Calculating statistical power
  45. Statistical power curve
  46. Improving statistical power of hypothesis tests
TENHO INTERESSE

Cursos Relacionados

Curso Análise de Dados Com o Power BI - 20778B

24 horas

Curso Análise de dados Excel Com Power BI - 20779B

16 horas

Curso Talend Data Integration Foundation

16 horas

Curso Talend Data Integration Advanced

16 horas

Curso Advanced Data Analysis and Dashboard Reporting

28 horas