Curso Statistics Foundations
16 horasVisão Geral
Se você acha que as estatísticas não têm nada a dizer sobre o que você faz, ou como você poderia fazer melhor, então você está errado ou precisa de um trabalho mais interessante.
- Stephen Senn
A estatística é a ciência da ciência de dados. Sem ele, sua tomada de decisão "orientada por dados" pode estar levando você para a beira do precipício. Uma compreensão sólida de raciocínio estatístico garante que você extraia apenas percepções válidas de seus dados.
Muitas armadilhas aguardam o explorador de dados incauto. Neste curso, você aprenderá como evitar erros embaraçosos que podem prejudicar meses de trabalho.
Você ganhará experiência prática com as ferramentas necessárias para entender seus dados e tirar as conclusões corretas. O foco está no pensamento estatístico. Os conceitos serão introduzidos intuitivamente antes de serem expandidos formalmente. Você aprenderá como pensar em termos de distribuições - não estimativas de um único ponto. Os métodos estatísticos serão introduzidos no contexto de como usá-los para obter insights e resolver problemas. Como bônus, você também terá a chance de usar o poderoso ambiente R padrão da indústria para fazer cálculos numéricos.
Introdução à Estatística é um curso essencial para qualquer pessoa técnica, gerencial ou administrativa - interessada em usar dados para informar sua tomada de decisão. Existem pacotes de certificação disponíveis com este treinamento.
Objetivo
Após realizar este curso você será capaz de:
- Visualize os dados
- Tire conclusões sobre os recursos e a qualidade dos conjuntos de dados
- Resuma seus dados
- Determinar correlação
- Pense nos números como distribuições
- Compreenda a amostragem e sua importância na inferência estatística
- Use o poder dos computadores para gerar distribuições para qualquer problema
- Calcular intervalos de confiança e valores p
- Faça inferências estatísticas válidas usando uma variedade de testes de hipótese
- Análise estatística crítica
- Projete e execute seus próprios projetos estatísticos
Publico Alvo
- Qualquer pessoa que tire conclusões a partir de números.
- Nenhum conhecimento prévio de estatísticas ou pacotes de software é necessário. Uma natureza curiosa e interesse em usar números para resolver problemas são essenciais.
Pre-Requisitos
- Os participantes devem ser capazes de compreender conceitos matemáticos básicos (nível de ensino médio) e ter um nível de conforto com o uso de softwares de computador, como o Excel.
Materiais
Português/InglêsConteúdo Programatico
Introduction
and Overview
- Course
philosophy
- Software
- Contents
What is Statistics?
- Definition
- Types of
statistician
- Variability
- Probability
- Let the die
roll!
- Die roll
outcomes
- Why is knowledge of statistics important?
- Descriptive
vs inferential statistics
- Inferring
population parameters
- Quantitative
data
- Qualitative
data
- R
statistical software
- RStudio
- Interactive
exercise manual demo
Exploratory Data Analysis
- What is exploratory data analysis (EDA)
- Histograms
and bar charts
- Bar chart vs
histogram
- Central
tendency and spread
- Bin width is
crucial
- Right-skewed
data
- Outliers
- Left-skewed
data
- Bimodal data
- Separate
subpopulations for analysis
- Individual
value plot
- Subpopulation
individual value plots
- Benefits of
boxplots
- Boxplot
- Boxplot vs
histogram
- Left-skewed
boxplot
- Compare
subpopulations using boxplots
- Swedish salaries by level of education
- Measures of
central tendency
- Mean vs
median
- Mean vs median for skewed data
- Mode
- Measures of
spread
- Range and
IQR
- Standard
deviation
- Six figure
summary
- Central
tendency and spread equations
- Quantiles
- Benefits of
scatterplots
- Scatterplot
- Highlighting
subgroups on scatterplot
- What is
correlation?
- Correlation
examples
- Random data
correlation
- Literacy
rate correlation
- # children
per woman correlation
- Interpreting
correlation coefficients
- Correlation
doesn’t imply causation
- Causation
doesn’t imply (linear) correlation
- Probability
Distributions
- Numbers are
mostly reckless estimates
- Random
variables
- Male life expectancy in UK distribution
- What’s the probability that a US man is 6’ or more?
- What is a probability distribution?
- Populations
vs samples
- Sampling the heights of 10 random American men
- Sampling the heights of 100,000 random American men
- Discrete
probability distributions
- Roll two dice and histogram the results
- Poisson
distribution
- Binary
probability distributions
- Probability distribution for cars/household in the UK
- Binomial
distribution
- Geometric
distribution
- Negative
Binomial distribution
- Continuous
probability distributions
- Uniform
distribution
- Triangular
distribution
- Normal
distribution
- Properties
of the normal distribution
- Distribution
of IQ scores
- Different means (same standard deviation)
- Different standard deviations (same mean)
- z-distribution
- 68–95–99.7
(empirical) rule
- Quantile-Quantile
(Q-Q) plot
- Q-Q plot of non-normal data
- Common probability distributions “family tree”
Sampling
- Samples are proxies for the population of interest
- Unfortunately,
samples vary
- Larger
samples exhibition less variation
- Statistics
vs parameters
- Distributions
involved in statistical inference
- Sampling
distribution of mean IQ
- Collecting
more IQ samples
- Sampling distribution of mean die roll
- Sampling distribution of mean project duration
- Create a
sampling distribution
- Central
limit theorem
- Implications of the central limit theorem
- Standard error of the mean (SEM)
- Impact of sample size on SEM
- What is a confidence interval?
- 95%
confidence interval
- Bigger
samples give greater precision
- Smaller confidence levels result in tighter intervals
- How should we interpret the confidence interval?
- Random
sampling
- Simple
random sampling
- Stratified
sampling
- Cluster
sampling
- What is
bootstrapping?
- Estimating
median life expectancy
Statistical Inference
- What is
statistical inference?
- Why must we use samples?
- Why do we need to conduct hypothesis tests?
- What is
hypothesis testing?
- Null hypothesis
- Alternative
hypothesis
- Rejecting
the null hypothesis
- One- vs Two-tailed hypothesis tests
- Choosing between one- and two-tailed tests
- What are
p-values?
- Significance
level (?)
- Types of
errors
- Confidence
levels vs significance levels
- Performing
hypothesis tests
- p-value
controversy
- When to use a t-test
- t-value
- t-distribution
- t-distributions
- Slot machine observed ”Return to Player”
- Are slot machine payouts within tolerance?
- Preform a t-test on RTP data using R
- Two-sample
t-test
- When to use a z-test
- Conducting hypothesis tests using z-scores
- When to use
a 2 test
- Education
and Brexit vote
- Brexit vote
breakdown
- 2 value
- 2
distributions
- Are education and Brexit vote related?
- When to use a F-test
- Conducting hypothesis tests using F-values
- F-distributions
- Height
distribution by sex
- Does height variation differ by sex?
- When to use analysis of variance (ANOVA)
- Determining
the F-value
- Are all diets the same?
- All diets are apparently not the same
- Normality
hypothesis tests
- Statistically
significant treatments?
- What is
statistical power?
- Calculating
statistical power
- Statistical
power curve
- Improving statistical power of hypothesis tests