-
Sobre o curso de R
SourceObjetivos
Fornecer informações básicas do software estatístico R e expor as principais ferramentas disponíveis atualmente para realização de análises estatísticas de forma produtiva e reproduzível, baseando-se na filosofia
tidy data
e nos pacotes de Hadley Wickham. O curso é considerado de nível intermediário, pois apresenta apenas a forma de utilização de ferramentas úteis, e não abrange tópicos mais profundos como orientação à objetos, o pacoteRcpp
, entre outros.Programa Resumido
O curso é destinado para estudantes que já conhecem ou desejam conhecer o software estatístico R e é focado em ferramentas para aumento da produtividade em análises estatísticas, tanto em relação a tratamento de dados e análise exploratória quanto a produção de relatórios e apresentações. Por utilizar tecnologias de fronteira, o curso mostra uma parte muito importante do R que muitas vezes é desconhecida até mesmo por programadores experientes na linguagem.
O curso foi estruturado em dois módulos. O primeiro módulo é de nivelamento e tem como objetivo introduzir os conceitos básicos de R, sintaxe e ferramentas principais. O segundo módulo foca nos pacotes desenvolvidos por Hadley Wickham para aumento de produtividade, bem como outras ferramentas úteis para ajuste de modelos e produção de relatórios e visualizações dinâmicas.
Programa
O curso é destinado para estudantes que já conhecem ou desejam conhecer o software estatístico R e é focado em ferramentas para aumento da produtividade em análises estatísticas, tanto em relação ao tratamento de dados e análise exploratória quanto à produção de relatórios e apresentações. Por utilizar tecnologias de fronteira, o curso mostra uma parte muito importante do R que muitas vezes é desconhecida até mesmo por programadores experientes na linguagem.
O curso está estruturado em dois módulos, descritos abaixo.
Pré-requisitos
O curso não exige nenhum pré-requisito, porém, conhecimento básico de estatística e um contato com alguma linguagem de programação auxiliarão em alguns tópicos.
Módulo Básico
- Introdução à linguagem script e vetorização. Definição por gênero e diferença (comparando com C, octave, java, python, etc).
- Um pouco de sintaxe (principalmente operadores lógicos,
if
eelse
, laçosfor
ewhile
). - Estruturas de dados.
- Subsetting.
- Leitura de bancos de dados (.xls, .csv, .txt).
- Vocabulário focado em algumas funções essenciais (
summary
,[
,\$
,%in%
,print
,cat
,str
,table
,plot
,ifelse
e as funções*pply
) - Criação de gráficos com a função
plot
Módulo Prático
- Manipulação de dados e análise descritiva básica usando
dplyr
etidyr
. Conceito detidy data
. - Gramática para gráficos e visualizações com
ggplot2
. - Ajuste de modelos de regressão e análise multivariada com funções do
base
,lmer
,lme4
emgcv
. - Web apps com o
shiny
. - Relatórios com RMarkdown e
knitr
. - Construção de pacotes no R com
devtools
eroxygen2
. - Laboratório de R, com um exemplo de banco de dados real para trabalhar com todo o ferramental apresentado.
Avaliação
Método:
Aulas (14h), exercícios para casa e resultados do laboratório (10h).
Critérios:
Média ponderada de exercícios e laboratório.