V tomto článku si projdeme seznam některých důležitých balíčků v R. Probereme nejoblíbenější a nejčastěji používané balíčky. Tyto balíčky nejsou řazeny v žádném pořadí, ale jsou součástí tohoto článku kvůli svým funkcím a různorodým operacím.
R je lingua franca datové vědy, která se skládá z obrovské zásobárny balíčků. Tyto balíčky oslovují různé obory, které využívají R pro své datové účely. V síti CRAN je 10 000 balíčků, což z ní činí oceán kvintesenciálních statistických funkcí. Ačkoli v tomto článku není možné vyjmenovat všechny balíčky, budeme se snažit zahrnout nejoblíbenější a nejčastěji používané balíčky v R.
Sledujte nejnovější technologické trendy
Přidejte se k DataFlair na Telegramu!!
Seznam balíčků v jazyce R
Seznam hlavních balíčků v programovacím jazyce R je následující:
tidyr
Jak název napovídá, používáme tidyr, aby byla data „uklizená“. Dobře spolupracuje s programem dplyr. Je to v podstatě evoluce balíčku reshape2, o kterém si povíme později.
Počkejte! Nejprve se naučte instalovat a používat balíčky v programování v R
ggplot2
Pomocí ggplot2 můžete vytvářet grafiku deklarativně. Ggplot2 je známý svými elegantními a kvalitními grafy, které ho odlišují od ostatních vizualizačních balíčků.
ggraph
ggraph je rozšíření ggplot2. Odstraňuje omezení ggplot2, tedy jeho závislost na tabulkových datech.
dplyr
Tuto knihovnu používáme k provádění zpracování a analýzy dat. Knihovna dplyr usnadňuje několik funkcí pro datové rámce v R.
Přehodnotíme si pojem Operace s datovými rámci v R
tidyquant
tidyquant je finanční balík, který se používá k provádění kvantitativní finanční analýzy. Přidává se do univerza tidyverse jako finanční balík. Můžeme jej použít pro import, analýzu a vizualizaci dat.
dygraphs
Balíček dygraphs v R poskytuje rozhraní k hlavní knihovně JavaScriptu, kterou můžeme použít pro tvorbu grafů. Používá se zejména pro vykreslování časových řad dat v R.
leaflet
Leaflet je open-source knihovna jazyka JavaScript pro vytváření interaktivních vizualizací. Populární webové stránky jako New York Times, Flickr, Github atd. používají leaflet. Balíček R leaflet usnadňuje interakci s ním.
Všechny základní knihovny JavaScriptu, které musíte znát!
ggmap
Jedná se o mapovací balíček, který slouží k vytyčování prostorových vizualizací. Skládá se také z různých nástrojů pro geolokaci a směrování.
glue
Vývojáři vytvořili tento balík pro provádění operací s daty. Tento balíček používáme pro vyhodnocování výrazů R, které se vyskytují v řetězci.
shiny
Pomocí balíčku shiny můžete vytvářet interaktivní a estetické webové aplikace pomocí R. Poskytuje také různá rozšíření s CSS, HTML widgety a JavaScriptem.
plotly
Balíček R ‚plotly‘ poskytuje online interaktivní a kvalitní grafy. Rozšiřuje se na základě knihovny JavaScript -plotly.js.
tidytext
Tento balíček poskytuje různé funkce text miningu pro zpracování textu a provádění analýzy sentimentu pomocí ‚dplyr‘, ‚ggplot‘ a dalších různých nástrojů.
Prozkoumejte projekt Data Science Project on Sentiment Analysis in R
stringr
Tento balík poskytuje konzistentní a snadno použitelné obaly pro balík ‚stringi‘, který usnadňuje běžné operace s řetězci.
reshape2
Tento balíček usnadňuje flexibilní restrukturalizaci a agregaci dat pomocí funkcí melt() a decast().
dichromat
Balíček R dichromat slouží k odstranění červeno-zelených nebo modro-zelených kontrastů z barev.
digest
Paket digest využíváme k vytváření kryptografických hash objektů funkcí R.
MASS
MASS poskytuje velké množství statistických funkcí. Poskytuje soubory dat, které jsou ve spojení s knihou „Modern Applied Statistics with S“.
caret
Balík caret poskytuje funkce pro provádění klasifikačních a regresních úloh. CaretEnsemble, funkce caret, slouží ke kombinaci různých modelů.
Než budete pokračovat dále, musíte se seznámit s klasifikací v programování v R.
e1071
Tato knihovna poskytuje užitečné funkce, které jsou nezbytné pro analýzu dat, jako jsou Fourierova transformace, Naive Bayes, shlukování, SVM a další různé funkce.
sentimentr
Tento balík poskytuje funkce pro provádění analýzy sentimentu. Počítá polaritu textu na úrovni vět a provádí agregaci podle řádků nebo seskupení proměnných.
Shrnutí
V předchozím článku jsme prošli seznam nejoblíbenějších balíků v R. Probrali jsme různé knihovny, které využíváme pro práci s daty, jejich analýzu a vizualizaci. Jazyk R je neustále se vyvíjející jazyk, který si vytvořil své pevné místo v odvětví datové vědy. Doufáme, že se vám čtení tohoto článku líbilo. Pokud jsme vynechali nějaký balíček, který považujete za důležitý, určitě nám napište komentář.
Další díl našeho seriálu o výuce R DataFlair – Statistika a programování v R
.