W tym artykule, przejdziemy przez listę niektórych ważnych pakietów w R. Omówimy najbardziej popularne i powszechnie używane pakiety. Pakiety te nie mają rankingu w dowolnej kolejności, ale są częścią tego artykułu ze względu na ich funkcjonalności i różnorodne operacje.
R jest lingua franca of Data Science, który składa się z ogromnego repozytorium pakietów. Pakiety te odwołują się do różnych dziedzin, które wykorzystują R do swoich celów związanych z danymi. W CRAN znajduje się 10 000 pakietów, co czyni go oceanem kwintesencji funkcji statystycznych. Chociaż nie jest możliwe, aby wymienić każdy pakiet w tym artykule, dołożymy wszelkich starań, aby uwzględnić najbardziej popularne i powszechnie używane pakiety w R.
Bądź na bieżąco z najnowszymi trendami technologicznymi
Join DataFlair on Telegram!
Lista pakietów w języku R
Lista głównych pakietów w języku programowania R jest następująca:
tidyr
Jak sama nazwa wskazuje, używamy tidyr, aby uporządkować dane. Działa on dobrze z dplyr. Jest to w zasadzie rozwinięcie pakietu reshape2, który omówimy później.
Czekaj! Najpierw naucz się instalować i używać pakietów w programowaniu w R
ggplot2
Dzięki ggplot2 możesz tworzyć grafikę deklaratywnie. ggplot2 jest znany z eleganckich i wysokiej jakości wykresów, co odróżnia go od innych pakietów wizualizacyjnych.
ggraph
ggraph jest rozszerzeniem ggplot2. Zdejmuje ograniczenie ggplot2, jakim jest jego zależność od danych tabelarycznych.
dplyr
Bibliotekę dplyr wykorzystujemy do przetwarzania i analizy danych. Biblioteka dplyr ułatwia kilka funkcji dla ramek danych w R.
Zrewidujmy koncepcję operacji na ramkach danych w R
tidyquant
tidyquant jest pakietem finansowym, który służy do przeprowadzania ilościowej analizy finansowej. Dodaje się on do uniwersum tidyverse jako pakiet finansowy. Możemy go używać do importowania, analizowania i wizualizacji danych.
dygraphs
Pakiet dygraphs w R zapewnia interfejs do głównej biblioteki JavaScript, którą możemy wykorzystać do tworzenia wykresów. Jest on szczególnie używany do wykreślania danych serii czasowych w R.
leaflet
Listlet jest biblioteką open-source JavaScript do tworzenia interaktywnych wizualizacji. Popularne strony internetowe takie jak New York Times, Flickr, Github, itp. używają leaflet. Pakiet R z leaflet ułatwia interakcję z nim.
Wszystkie niezbędne biblioteki JavaScript, które musisz znać!
ggmap
Jest to pakiet mapujący, który służy do tworzenia wizualizacji przestrzennych. Składa się on również z różnych narzędzi do geolokalizacji i wyznaczania tras.
glue
Deweloperzy stworzyli ten pakiet do przeprowadzania operacji wranglowania danych. Używamy tego pakietu do oceny wyrażeń R, które są obecne w łańcuchu znaków.
shiny
Z pomocą shiny można tworzyć interaktywne i estetyczne aplikacje internetowe przy użyciu R. Zapewnia on również różne rozszerzenia z CSS, widżetami HTML i JavaScript.
plotly
Pakiet R 'plotly’ zapewnia interaktywne i wysokiej jakości wykresy online. Rozszerza się on o bibliotekę JavaScript -plotly.js.
tidytext
Pakiet ten zapewnia różne funkcje eksploracji tekstu do przetwarzania słów i przeprowadzania analizy sentymentu poprzez 'dplyr’, 'ggplot’ i inne różne narzędzia.
Zapoznaj się z Data Science Project on Sentiment Analysis in R
stringr
Pakiet ten dostarcza spójnych i prostych w użyciu wrapperów dla pakietu 'stringi’, który ułatwia wspólne operacje na łańcuchach.
reshape2
Pakiet ten ułatwia elastyczną restrukturyzację i agregację danych przy użyciu funkcji melt() i decast().
dichromat
Pakiet R dichromat służy do usuwania kontrastów czerwono-zielonych lub niebiesko-zielonych z kolorów.
digest
Korzystamy z pakietu digest do tworzenia kryptograficznych obiektów hash funkcji R.
MASS
MASS zapewnia dużą liczbę funkcji statystycznych. Udostępnia zbiory danych, które są w połączeniu z książką „Modern Applied Statistics with S”.
caret
Pakiet caret udostępnia funkcje do wykonywania zadań klasyfikacji i regresji. CaretEnsemble, cecha pakietu caret, służy do łączenia różnych modeli.
Musisz wiedzieć o Klasyfikacji w Programowaniu w R zanim przejdziesz dalej
e1071
Biblioteka ta dostarcza użytecznych funkcji, które są niezbędne do analizy danych, takich jak Transformacja Fouriera, Naive Bayes, Klastrowanie, SVM i inne różne funkcje.
sentimentr
Pakiet ten dostarcza funkcji do przeprowadzania analizy sentymentu. Oblicza on polaryzację tekstu na poziomie zdania i wykonuje agregację według wierszy lub zmiennych grupujących.
Podsumowanie
W powyższym artykule, przeszliśmy przez listę najpopularniejszych pakietów w R. Omówiliśmy różne biblioteki, które wykorzystujemy do obróbki, analizy i wizualizacji danych. R jest stale rozwijającym się językiem, który stworzył swoją pozycję w branży Data Science. Mamy nadzieję, że lektura tego artykułu sprawiła Ci przyjemność. Jeśli pominęliśmy jakiś pakiet, który uważasz za ważny, skomentuj go.
Kolejny krok w naszej serii DataFlair Tutorial R – Statystyka i programowanie w R