1 Introdução
O Zen do R tem o objetivo de ser um livro sobre programação para quem não programa. Atualmente muitas pessoas de diferentes áreas do conhecimento acabam precisando usar a linguagem R por causa do seu grande potencial para programação estatística, mas ficam perdidas depois que aprendem o básico sobre a linguagem. Nesse sentido, este é um livro para pessoas “não-programadoras” no que se refere a treinamento formal; isto não é uma introdução ao R, mas sim um guia sobre como usar o R de forma eficiente no dia-a-dia. O Zen do R também pretende destoar dos manuais mais secos e técnicos sobre programação, utilizando uma linguagem leve e acessível justamente porque parte-se do princípio de que ele será utilizado em conjunto com algum outro texto (seco e técnico) sobre como de fato programar em R.
A escolha do R é parcialmente arbitrária. Nada impede de você usar Python para
a análise de dados, mas ao longo de alguns anos de experiência notou-se
que o fato de o R ter sido feito com análise de dados em mente acaba
sendo uma vantagem muito difícil de ignorar. Fora isso, o tidyverse
, as
infinitas ferramentas do RStudio e o engajamento da comunidade fazem com que
nós achemos o R a verdadeira linguagem do data science.
Por isso, o Zen do R é um guia para acalmar os nervos de quem se aventura pela primeira vez em um grande projeto em R.
1.1 Sobre o livro
A grande piada do título é que o caminho para o fluxo ideal de programação é análogo ao caminho descrito pelo Budismo para a libertação do espírito. Parece muito estranho que essas duas coisas tenham alguma relação, mas a vida é uma boa metáfora para muitos processos que encontramos no dia-a-dia!
1.1.1 O que você vai aprender
Essencialmente você vai aprender a usar alguns pacotes e como trabalhar com quatro aspectos do processo de análise de dados: ambiente, versões, dados e arquivos. Não é necessário ler o livro em ordem porque cada uma dessas quatro sessões são completamente independentes.
Sinta-se livre para pular todos os tópicos sobre os quais você sentir que já sabe o suficiente. Mas não se iluda, porque nenhum dos tópicos é inútil ou pode ser simplesmente ignorado; quanto maior for um projeto (seja uma tese de mestrado ou uma análise de dados médicos), mais necessários serão os tópicos mais avançados.
1.1.2 O que você não vai aprender
Primeiramente, você não vai aprender a programar R. Esse assunto é extremamente extenso e já existem livros o suficiente para ajudar com isso (vide o livro da Curso-R ou R for Data Science), então não vou me preocupar com os detalhes do código ou com qual guia de estilo seguir.
Se você gosta de fazer códigos longos e velozes usando o base-r
, se você ama
as pipelines do tidyverse
, se você paraleliza todos os seus loops… Nada
disso importa aqui; não vou dizer qual é o melhor jeito de programar1.
Aqui você vai conhecer somente as melhores ferramentas para organizar o seu
fluxo de programação.
Apesar de terem nomes parecidos, O Zen do R e O Zen do Python são diferentes justamente por causa disso. O livro do Python pretende dar sugestões de como organizar e escrever o seu código, o que não será feito aqui.
1.2 Pré-requisitos
Como talvez já tenha ficado claro, um dos principais pré-requisitos deste livro é saber programar pelo menos um pouco de R. Você não precisa ser especialista, mas, para ter a necessidade de melhorar o seu fluxo de análise, você antes precisa estar fazendo alguma análise.
Fora isso, o segundo principal pré-requisito é um ambiente de desenvolvimento. Grande parte das dicas do livro são baseadas em funcionalidades integradas ao RStudio, então se você quiser tirar o maior proveito possível dos ensinamentos talvez valha à pena instalar a IDE. Ainda no tocante ao R, você precisará ter instalado pelo menos os três pacotes a seguir:
# Conteúdo principal do livro
install.packages(c("usethis", "renv", "tidyverse"))
# Se você quiser reproduzir os exemplos
install.packages("devtools")
Você também precisa de um computador funcionando com um sistema operacional razoavelmente moderno. E uma conexão à internet.
1.3 Principais referências
O Zen do R se baseia em inúmeras referências que normalmente serão citadas juntamente com o próprio conteúdo. Mas algumas mais gerais acabariam sendo citadas o tempo todo e portanto acabarão ficando aqui:
E também não tenho paciência para entrar em mais nenhum debate “base vs. tidyverse”↩︎