Visão Geral
O Curso R Programming Foundation, ensina aos participantes como usar a programação R para explorar dados de uma variedade de fontes, construindo modelos inferenciais e gerando tabelas, gráficos e outras representações de dados.
Objetivo
Após realizar este Curso R Programming Foundation você será capaz de:
- Dominar o uso do ambiente interativo R e RStudio
- Expanda R instalando pacotes R
- Explorar e entender como usar a documentação R
- Leia dados estruturados em R de várias fontes
- Compreenda os diferentes tipos de dados em R
- Compreenda as diferentes estruturas de dados em R
- Entenda como criar e manipular datas em R
- Use a coleção tidyverse de pacotes para manipular dataframes
- Escrever funções R definidas pelo usuário
- Use declarações de controle
- Escreva construções de Loop em R
- Use a família de funções apply para iterar funções nos dados
- Expanda iteração e programação através do pacote Purrr
- Remodele os dados de longo para amplo e vice-versa para oferecer suporte a diferentes análises
- Realize operações de mesclagem com R
- Compreender dividir-aplicar-combinar (operações em grupo) em R
- Identificar e lidar com dados ausentes
- Manipule strings em R
- Compreenda as expressões regulares básicas em R
- Compreenda os gráficos R de base
- Concentre-se em gráficos GGplot2 para R para gerar gráficos
- Use RMarkdown para gerar relatórios reproduzíveis de maneira programática
- Use R para estatísticas descritivas
- Use R para estatísticas inferenciais
- Escreva modelos multivariados em R (modelos lineares gerais)
- Compreenda a confusão e o ajuste em modelos multivariados
- Compreenda a interação em modelos multivariados
- Prever / pontuar novos dados usando modelos
- Compreender funções não lineares básicas em modelos
- Entenda como vincular dados, métodos estatísticos e questões acionáveis
Pre-Requisitos
Os alunos devem ter conhecimento de estatística básica (teste t, teste do qui-quadrado, regressão) e saber a diferença entre estatística descritiva e inferencial. Nenhuma experiência de programação é necessária.
Materiais
Português | Inglês
Conteúdo Programatico
Overview
- History of R
- Advantages and disadvantages
- Downloading and installing
- How to find documentation
Introduction
- Using the R console and RStudio
- Getting help
- Learning about the environment
- Writing and executing scripts
- Object oriented programming
- Introduction to vectorized calculations
- Introduction to data frames
- Installing and loading packages
- Working directory
- Saving your work
Variable types and data structures in base R
- Variables and assignment
- Data types
- Numeric, character, boolean, and factors
- Data structures
- Vectors, matrices, arrays, dataframes, lists
- Indexing, subsetting
- Assigning new values
- Viewing data and summaries
- Naming conventions
- Objects
Getting data into the R environment with readr
- Built-in data
- Reading data from structured text files
- Reading data using ODBC
Dataframe manipulation with dplyr
- Introduction to tibbles, enhanced data frames
- Renaming columns
- Adding new columns
- Binning data (continuous to categorical)
- Combining categorical values
- Transforming variables
- Handling missing data
- Merging datasets together
- Stacking datasets together (concatenation)
Handling dates in R using lubridate
- Date and date-time classes in R
- Formatting dates for modeling
Exploratory data analysis (descriptive statistics)
- Continuous data
- Distributions
- Quantiles, mean
- Bi-modal distributions
- Histograms, box-plots
- Categorical data
- Tables
- Barplots
- Group by calculations with dplyr
- Split-apply-combine
- Reshaping and pivoting data in R (long to wide with aggregation)
- Melt and cast
- pivot_wider and _longer with tidyr
Working with text data
- Finding and matching patterns in text
- Stringr package for text manipulation
- Introduction to regular expressions in R
- Categorical data wrangling with forcats
Control flow
- Truth testing
- Branching
- Looping
Functions in depth
- Parameters
- Return values
- Variable scope
- Exception handling
Applying functions across dimensions
- Sapply, lapply, apply
- Programming with map and purrr
Graphics in R Overview
- Base graphics system in R
- Scatterplots, histograms, barcharts, box and whiskers, dotplots
- Labels, legends, titles, axes
- Exporting graphics to different formats
Advanced R graphics: ggplot2
- Understanding the grammar of graphics
- Quick plots (qplot function)
- Building graphics by pieces (ggplot function)
- Understanding geoms (geometries)
- Linking chart elements to variable values
- Controlling legends and axes
- Exporting graphics
Inferential Statistics
- Bivariate correlation
- T-test and non-parametric equivalents
- Chi-squared test
General Linear Regression Models in R
- Understanding formulas
- Linear and logistic regression models
- Regression plots
- Confounding / interaction in regression
- Evaluating residuals
- Scoring new data from models (prediction)
- Useful plots from regression models
TENHO INTERESSE