Curso Modeling Data for Inference

32 horas

Visão Geral

Este Curso Modeling Data for Inference: Modelagem de dados para inferência ensina os participantes como usar Python para realizar inferência causal em dados observacionais. Os participantes aprendem como trabalhar com modelos inferenciais, dados faltantes e design experimental.

Objetivo

Após realizar este Curso Modeling Data for Inference você será capaz de:

Execute inferência causal em dados observacionais usando Python
Execute e interprete testes de hipótese nula em Python
Implementar modelos lineares generalizados em modelos estatísticos
Entenda os dados ausentes
Imputar dados ausentes
Gere cálculos de potência precisos
Implementar métodos não paramétricos para testar hipóteses.
Use estruturas de inferência causal para identificar efeitos causais a partir de dados observacionais

Pre-Requisitos

Os participantes devem ter uma base sólida em programação Python para análises descritivas.

Materiais

Inglês/Português/Lab Prático

Conteúdo Programatico

Introduction

GLMs with Python using Stats Models

Applying Statistical Models for Analysis in Python: The A/B test
Explanation of statsmodels library of functions
Inferential and descriptive statistics refresher
Implementing A/B tests

Modeling Continuous Data (Linear models)

Formulation of the simple linear model
Application of the intercept only, null model
Binary predictor
Interpreting results
Categorical predictor
Continuous predictor
Polynomial expansions
Multiple linear regression
Spline models
Interaction terms
Picking the “best” model
Discussion of confounding, interaction terms, and model building approaches

Modeling Binary Data (Logistic models)

Discussion of the generalized linear model
The Logit link function
Binomial distribution
Intercept only model
Back transformation of coefficients
Simple predictor
Multiple predictors
Odds ratio interpretations
Generating a scoring data set
Predicting from the model with new data
Modeling Count Outcomes
How are count outcomes different?
Poisson models
Over dispersed modeling options
Log link functions
Using offsets to model rates / uneven follow-up

Power Analyses/Study Design

Understanding and estimating statistical power
Type 1 and type 2 errors
Using existing power estimators
Simulating power through the data-generating process

Non-Parametric Analysis Methods

Using bootstrapping/permutation tests
Bootstrapping versus depending on asymptotic behavior to estimate confidence intervals
How different/stable are my results?
resampling a data set
bias-corrected bootstrap interval
Extending the bootstrap function to calculate more statistics
Permutation tests for p-values

Missing data

Quantifying
Visualizing missing data
MAR,MCAR,MNAR
Sensitivity analysis
Imputation
MICE/trees pre-processing

Time to Event (Survival) Analysis

Visualizing Hazards Across Time
Understanding the Log Rank Test
Cox Proportional Hazards Modeling
Understanding and interpreting the Hazard Ratio
Model diagnostics and assumptions
Implementing Time Varying Covariates
Parametric Survival Models
Weibull Model
Exponential Model
Predicting Failure Times

Causal Inference: The Potential Outcomes Framework

Defining treatment effects (ATT, ATE)
Identifying populations of interest
Defining your causal hypothesis
Understanding the counterfactual
Establishing the causal diagram for your problem
Different methods for conditioning on variables:
Propensity Scores
Direct regression adjustment
G-computation formulas
Instrumental variable analysis

TENHO INTERESSE

Cursos Relacionados

Curso Data Lake Inteligente Fundamentos para Analistas

16 horas

Ver Curso

Curso DBA Bigdata Greenplum

24 Horas

Ver Curso

Curso Apache Spark and Scala

24 horas de curso pratico

Ver Curso

Curso BigQuery Google Foudation

16 horas

Ver Curso

Curso Bamboo Integração contínua

24 Horas

Ver Curso

Curso Big Data Foundation

16 horas

Ver Curso

Curso Python 6 Projetos Python com Programacao Foundation to Advanced

60 horas

Ver Curso

Curso Big Data Business Intelligence for Criminal Intelligence Analysis

40h

Ver Curso

Curso Cloudera for Apache Kafka Overview

32 horas

Ver Curso

Curso Cloudera Data Engineering Developing Applications with Apache Spark

32 horas

Ver Curso

Curso Modeling Data for Inference

Curso Modeling Data for Inference

Visão Geral

Objetivo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Data Lake Inteligente Fundamentos para Analistas

Curso DBA Bigdata Greenplum

Curso Apache Spark and Scala

Curso BigQuery Google Foudation

Curso Bamboo Integração contínua

Curso Big Data Foundation

Curso Python 6 Projetos Python com Programacao Foundation to Advanced

Curso Big Data Business Intelligence for Criminal Intelligence Analysis

Curso Cloudera for Apache Kafka Overview

Curso Cloudera Data Engineering Developing Applications with Apache Spark

O que você quer aprender hoje?

Curso Modeling Data for Inference

Curso Modeling Data for Inference

Visão Geral

Objetivo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Nível

Calendário

Receba todas informações

Cursos Relacionados

Curso Data Lake Inteligente Fundamentos para Analistas

Curso DBA Bigdata Greenplum

Curso Apache Spark and Scala

Curso BigQuery Google Foudation

Curso Bamboo Integração contínua

Curso Big Data Foundation

Curso Python 6 Projetos Python com Programacao Foundation to Advanced

Curso Big Data Business Intelligence for Criminal Intelligence Analysis

Curso Cloudera for Apache Kafka Overview

Curso Cloudera Data Engineering Developing Applications with Apache Spark