Arte por Allison Horst
Contato
Email: milz.bea@gmail.com
Blog: beamilz.com
Sobre mim
Co-organizadora: R-Ladies São Paulo / Latin-R / satRday São Paulo
Professora na Curso-R
Professora no Programa de Verão IME/USP
Instrutora de Tidyverse certificada pela RStudio
Organizando a tradução do livro R4DS: https://cienciadedatos.github.io/pt-r4ds/
Contato
Email: terezalacer@gmail.com
Blog: terezalacerda.com
Sobre mim
Formada em Estatística pelo IME/USP
Cientista de Dados/Programadora na Curso-R
Caso não tenha, crie uma conta no serviço:
Dica: Você pode criar uma conta vinculada ao Gmail ou GitHub.
O minicurso é destinado a pessoas que já tem um conhecimento básico sobre tidyverse e dplyr (como selecionar colunas, filtrar linhas, ordenar linhas, agrupar e sumarizar) e querem aprender mais.
O foco minicurso será realizado com exemplos práticos.
Falaremos sobre boas práticas também!
Arte por Allison Horst
Fonte: Ciclo da Ciência de Dados traduzido pela Curso-R. A versão original está disponível no livro R for Data Science.
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Fonte: Zen do R
Não use caracteres especiais para nomear arquivos, pastas, variáveis, colunas, funções, e por aí vai!
Use projetos do RStudio. Crie um .Rproj
para cada projeto. Dentro deste projeto, guarde de forma organizada os arquivos relacionados à este projeto.
Tenha uma pasta de dados brutos (ex. data-raw/
) e dados tratados (ex. data/
). NÃO MISTURE!
Sempre que receber/baixar uma nova base de dados, NÃO FAÇA ALTERAÇÕES MANUALMENTE NOS DADOS BRUTOS!
Pense sempre na reprodutibilidade :)
Arte por Allison HorstIllustrations from the Openscapes blog Tidy Data for reproducibility, efficiency, and collaboration by Julia Lowndes and Allison Horst.
Arte por Allison HorstIllustrations from the Openscapes blog Tidy Data for reproducibility, efficiency, and collaboration by Julia Lowndes and Allison Horst.
Arte por Allison HorstIllustrations from the Openscapes blog Tidy Data for reproducibility, efficiency, and collaboration by Julia Lowndes and Allison Horst.
Arte por Allison HorstIllustrations from the Openscapes blog Tidy Data for reproducibility, efficiency, and collaboration by Julia Lowndes and Allison Horst.
A base de dados que usaremos foi extraída do sistema INFOAGUAS/ CETESB
Dados de qualidade de águas superficiais no Estado de SP.
2008 à 2022, Fósforo total e clorofila-a, pontos na Represa Billings.
Importando apenas uma das base de dados:
Rows: 102
Columns: 26
$ `Período DE` <chr> "01/01/2008", "01/01/2008", "01/01/2008", "0…
$ `Período ATE` <chr> "31/12/2012", "31/12/2012", "31/12/2012", "3…
$ Cod_Interaguas <chr> "1386", "1386", "1386", "1386", "1386", "138…
$ `Tipo Rede` <chr> "Rede Básica", "Rede Básica", "Rede Básica",…
$ UGRHI <chr> "06 - ALTO TIÊTE", "06 - ALTO TIÊTE", "06 - …
$ `Código Ponto` <chr> "BILL02030", "BILL02030", "BILL02030", "BILL…
$ `Status Ponto` <chr> "Ativo", "Ativo", "Ativo", "Ativo", "Ativo",…
$ `Data Coleta` <chr> "22/01/2008", "26/03/2008", "14/05/2008", "1…
$ `Hora Coleta` <chr> "11:20", "11:22", "12:30", "11:50", "11:20",…
$ Parametro <chr> "Clorofila-a", "Clorofila-a", "Clorofila-a",…
$ Sinal <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ Valor <chr> "18,71000000", "28,87000000", "31,19000000",…
$ Unidade <chr> "µg/L", "µg/L", "µg/L", "µg/L", "µg/L", "µg/…
$ `Tipo Parâmetro` <chr> "5- Hidrobiológicos", "5- Hidrobiológicos", …
$ `Sistema Hídrico` <chr> "Reservatório Billings - BILL", "Reservatóri…
$ `Tipo de Sistema Hídrico` <chr> "Reservatório (Lêntico)", "Reservatório (Lên…
$ CLASSE <chr> "Classe 2", "Classe 2", "Classe 2", "Classe …
$ Município <chr> "SÃO PAULO", "SÃO PAULO", "SÃO PAULO", "SÃO …
$ UF <chr> "SP", "SP", "SP", "SP", "SP", "SP", "SP", "S…
$ `Inicio Operação` <chr> "01/01/2007", "01/01/2007", "01/01/2007", "0…
$ `Fim Operação` <lgl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
$ Latitude <chr> "23 43 04", "23 43 04", "23 43 04", "23 43 0…
$ Longitude <chr> "46 39 51", "46 39 51", "46 39 51", "46 39 5…
$ Altitude <chr> "743", "743", "743", "743", "743", "743", "7…
$ Localização <chr> "No meio do corpo central, cerca de 1,5 km d…
$ Captação <chr> "N", "N", "N", "N", "N", "N", "N", "N", "N",…
Informações úteis: quais variáveis temos? qual é o nome das colunas? qual é o tipo das colunas?
Outras perguntas: Qual é o formato da base de dados? Qual é a unidade amostral (o que cada linha representa)?
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Arte por Allison Horst
Slides por Beatriz Milz, feito com Quarto.