Ebben a cikkben az R néhány fontos csomagjának listáját tekintjük át. A legnépszerűbb és leggyakrabban használt csomagokat tárgyaljuk. Ezek a csomagok nincsenek sorrendben, hanem funkcionalitásuk és változatos műveleteik miatt szerepelnek ebben a cikkben.
Az R az adattudomány lingua franca-ja, amely csomagok hatalmas tárházából áll. Ezek a csomagok különböző területeket szólítanak meg, amelyek az R-t használják adatkezelési célokra. A CRAN-ban 10 000 csomag található, ami a kvintesszenciális statisztikai funkciók óceánjává teszi. Bár ebben a cikkben nem lehet minden egyes csomagot megnevezni, mindent megteszünk azért, hogy az R legnépszerűbb és leggyakrabban használt csomagjai szerepeljenek.
Maradjon naprakész a legújabb technológiai trendekkel
Join DataFlair on Telegram!!
A csomagok listája az R-ben
Az R programozási nyelv főbb csomagjainak listája a következő:
tidyr
Amint a neve is mutatja, a tidyr-t arra használjuk, hogy az adatokat “rendbe tegyük”. Jól együttműködik a dplyr-rel. Ez lényegében a reshape2 csomag továbbfejlesztése, amelyet később tárgyalunk.
Várj! Először tanuljuk meg a csomagok telepítését és használatát az R programozásban
ggplot2
A ggplot2-vel deklaratív módon hozhatunk létre grafikonokat. A ggplot2 híres az elegáns és minőségi grafikáiról, ami megkülönbözteti más vizualizációs csomagoktól.
ggraph
Azggraph a ggplot2 egy kiterjesztése. Megszünteti a ggplot2 korlátját, vagyis a táblázatos adatoktól való függőségét.
dplyr
Ezt a könyvtárat használjuk adatfeldolgozás és adatelemzés elvégzésére. A dplyr könyvtár számos funkciót könnyít meg az adatkeretek számára az R-ben.
Megismételjük az R adatkeret műveletek fogalmát
tidyquant
A tidyquant egy pénzügyi csomag, amelyet kvantitatív pénzügyi elemzések elvégzésére használunk. Pénzügyi csomagként a tidyverse univerzumát egészíti ki. Használhatjuk az adatok importálására, elemzésére és vizualizálására.
dygraphs
A dygraphs csomag az R-ben egy interfészt biztosít a fő JavaScript könyvtárhoz, amelyet grafikonok készítéséhez használhatunk. Különösen idősoros adatok ábrázolásához használható R-ben.
leaflet
A leaflet egy nyílt forráskódú JavaScript könyvtár interaktív vizualizációk készítésére. Olyan népszerű weboldalak, mint a New York Times, a Flickr, a Github stb. használják a leafletet. A leaflet R csomagja megkönnyíti a vele való interakciót.
Az összes alapvető JavaScript könyvtár, amit ismernie kell!
ggmap
Ez egy térképes csomag, amelyet térbeli vizualizációk lehatárolására használnak. Különböző geolokációs és útvonaltervező eszközöket is tartalmaz.
glue
A fejlesztők az adatfeldolgozás műveletének elvégzésére készítették ezt a csomagot. Ezt a csomagot a stringben található R-kifejezések kiértékelésére használjuk.
shiny
A shiny segítségével interaktív és esztétikus webes alkalmazásokat fejleszthetünk az R segítségével. Különböző bővítményeket is biztosít CSS, HTML widgetek és JavaScript segítségével.
plotly
A ‘plotly’ R csomag online interaktív és minőségi grafikonokat biztosít. A -plotly.js JavaScript könyvtárra épül.
tidytext
Ez a csomag a szövegbányászat különböző funkcióit biztosítja a szövegfeldolgozáshoz és az érzéselemzés elvégzéséhez a ‘dplyr’, ‘ggplot’ és más különféle eszközök segítségével.
Fedezze fel a Data Science Project on Sentiment Analysis in R
stringr
Ez a csomag konzisztens és egyszerűen használható wrappereket biztosít a ‘stringi’ csomaghoz, amely megkönnyíti az általános stringműveleteket.
reshape2
Ez a csomag megkönnyíti az adatok rugalmas átstrukturálását és aggregálását a melt() és decast() függvények segítségével.
dichromat
Az R dichromat csomag a vörös-zöld vagy kék-zöld kontrasztok eltávolítására szolgál a színekből.
digest
A digest csomagot az R függvények kriptográfiai hash objektumainak létrehozására használjuk.
MASS
A MASS nagyszámú statisztikai függvényt biztosít. Olyan adatkészleteket biztosít, amelyek a “Modern Applied Statistics with S” című könyvhöz kapcsolódnak.
caret
A caret csomag az osztályozási és regressziós feladatok elvégzéséhez nyújt függvényeket. A caretEnsemble, a caret egyik funkciója a különböző modellek kombinálására szolgál.
Az osztályozásról az R programozásban kell tudnia, mielőtt továbblépne
e1071
Ez a könyvtár olyan hasznos függvényeket biztosít, amelyek az adatelemzéshez elengedhetetlenek, mint a Fourier-transzformáció, Naive Bayes, klaszterezés, SVM és egyéb különféle funkciók.
sentimentr
Ez a csomag a szentimentelemzés elvégzéséhez nyújt függvényeket. Kiszámítja a szöveg polaritását mondatszinten, és aggregációt végez sorok vagy csoportosító változók szerint.
Összefoglaló
A fenti cikkben végigvettük az R legnépszerűbb csomagjainak listáját. Különböző könyvtárakat tárgyaltunk, amelyeket adatfeldolgozásra, elemzésre és vizualizációra használunk. Az R egy folyamatosan fejlődő nyelv, amely megvetette a lábát az adattudományban. Reméljük, hogy élvezték a cikk olvasását. Ha kihagytunk valamilyen csomagot, amelyet fontosnak tartasz, mindenképpen kommentáld.
A következő lépés az R Tutorial DataFlair sorozatunkban – Statisztika és R programozás