Instalação e uso do Package tidyverse
Instale todos os pacotes no tidyverse executando install.packages("tidyverse").
Execute a library(tidyverse) para carregar o núcleo do tidyverse e torná-lo disponível em sua sessão R atual.
Saiba mais sobre o pacote tidyverse em https://tidyverse.tidyverse.org.
Estrutura básica do tidyverse
A estrutura básica do tidyverse inclui os pacotes que você provavelmente usará nas análises de dados. Os seguintes pacotes estão incluídos:
ggplot2
O ggplot2 é um sistema de criação gráfica declarativa, baseado na Gramática de gráficos. Você fornece os dados, diz ao ggplot2 como mapear variáveis para a estética, quais elementos gráficos utilizar, e ele cuida dos detalhes.
dplyr
dplyr fornece uma gramática de manipulação de dados, fornecendo um conjunto consistente de comandos que resolvem os desafios mais comuns de manipulação de dados.
tidyr
tidyr fornece um conjunto de funções que ajudam você a obter organizar os dados. Dados organizados são dados com uma estrutura consistente: em resumo, cada variável vai em uma coluna, e cada coluna é uma variável.
readr
readr fornece uma maneira rápida e amigável de ler dados tabulares (como csv, tsv, e fwf). Ele é projetado para analisar de forma flexível muitos tipos de dados.
purrr
purrr melhora o conjunto de ferramentas de programação funcional (FP) do R, fornecendo um conjunto completo e consistente de ferramentas para trabalhar com funções e vetores. Uma vez que você domina os conceitos básicos, o purrr permite que você substitua muitos loops por códigos mais fáceis de escrever e mais expressivos.
tibble
tibble é uma representação moderna do dataframe. Tibbles são dataframes preguiçosos e rudes: eles fazem menos e reclamam mais, forçando você a enfrentar os problemas mais cedo, normalmente levando a um código mais limpo e expressivo.
stringr
stringr fornece um conjunto coeso de funções projetadas para tornar o trabalho com texto o mais fácil possível. Ele é construído sobre o stringi, que usa a biblioteca ICU C para fornecer implementações rápidas e corretas de manipulações comuns de texto
forcats
forcats fornece um conjunto de ferramentas úteis que resolvem problemas comuns com fatores. R utiliza fatores para lidar com variáveis categóricas, variáveis que têm um conjunto fixo e conhecido de valores possíveis.
O tidyverse também inclui muitos outros pacotes com uso mais especializado. Eles não são carregados automaticamente com biblioteca(tidyverse), então você precisará carregar cada um deles com sua própria chamada à biblioteca.
Importação de dados
Assim como o readr, o pacote tidyverse instala uma série de outros pacotes para a leitura de dados:
DBIpara bancos de dados relacionais. Você precisará emparelharDBIcom um backend específico de banco de dados comoRSQLite,RMariaDB,RPostgres, ouodbc.Saiba mais em https://db.rstudio.com.havenpara dados SPSS, Stata, e SAS.httrpara web APIs.readxlpara planilhas .xls e .xlsx.rvestpara raspagem da web.jsonlitepara JSON. (mantido por Jeroen Ooms.)xml2para XML.
Wrangle
Além de tidyr e dplyr, há cinco pacotes (incluindo stringr e forcats) que são projetados para trabalhar com tipos específicos de dados:
Programa
Além do purrr, que fornece métodos muito consistentes e naturais para iteração em objetos R, há dois pacotes adicionais que ajudam nos desafios gerais de programação:
Modelo
A modelagem com o tidyverse possibilita a coleção de pacotes de tidymodels, que em grande parte substituem o pacote modelr usado no R4DS. Estes pacotes fornecem uma base abrangente para a criação e utilização de modelos de todos os tipos. Visite o Guia de Introdução ou, para exemplos mais detalhados, vá direto para a página Aprender.