Tässä artikkelissa käymme läpi luettelon eräistä tärkeistä R-paketeista. Käsittelemme suosituimpia ja yleisimmin käytettyjä paketteja. Nämä paketit eivät ole missään järjestyksessä, vaan ne ovat osa tätä artikkelia niiden toiminnallisuuksien ja monipuolisten toimintojen vuoksi.
R on datatieteen lingua franca, joka koostuu valtavasta pakettivarastosta. Nämä paketit vetoavat eri aloihin, jotka käyttävät R:ää datatarkoituksiinsa. CRANissa on 10 000 pakettia, joten se on kuin valtameri keskeisiä tilastollisia toimintoja. Vaikka tässä artikkelissa ei ole mahdollista nimetä jokaista yksittäistä pakettia, teemme parhaamme sisällyttääksemme suosituimmat ja yleisimmin käytetyt R:n paketit.
Pysy ajan tasalla uusimmista teknologiatrendeistä
Join DataFlair on Telegram!!
Luettelo R:n paketeista
Luettelo R-ohjelmointikielen tärkeimmistä paketeista on seuraava:
tidyr
Kuten nimestä voi päätellä, käytämme tidyriä saadaksemme datan ”siistiksi”. Se toimii hyvin dplyrin kanssa. Se on periaatteessa reshape2-paketin evoluutio, josta puhumme myöhemmin.
Odota! Opettele ensin asentamaan ja käyttämään paketteja R-ohjelmoinnissa
ggplot2
Ggplot2:n avulla voit luoda grafiikoita deklaratiivisesti. ggplot2 on kuuluisa tyylikkäistä ja laadukkaista graafeistaan, jotka erottavat sen muista visualisointipaketeista.
ggraph
ggraph on ggplot2:n laajennus. Se poistaa ggplot2:n rajoituksen eli sen riippuvuuden taulukkomuotoisesta datasta.
dplyr
Käytämme tätä kirjastoa datan käsittelyyn ja data-analyysiin. dplyr-kirjasto helpottaa useita funktioita datakehyksiä varten R:ssä.
Katsastellaan R:n datakehysoperaatioiden käsitettä
tidyquant
tidyquant on finanssialan paketti, jota käytetään kvantitatiivisen finanssianalyysin suorittamiseen. Se lisää tidyverse-universumia finanssipakettina. Voimme käyttää sitä tietojen tuontiin, analysointiin ja visualisointiin.
dygraphs
R:n dygraphs-paketti tarjoaa rajapinnan tärkeimpään JavaScript-kirjastoon, jota voimme käyttää kaavioihin. Sitä käytetään erityisesti aikasarjadatan piirtämiseen R:ssä.
leaflet
Laflet on avoimen lähdekoodin JavaScript-kirjasto interaktiivisten visualisointien luomiseen. Suosittuja verkkosivustoja, kuten New York Times, Flickr, Github jne. käyttävät leafletia. leafletin R-paketti helpottaa vuorovaikutusta sen kanssa.
Kaikki olennaiset JavaScript-kirjastot, jotka sinun on tiedettävä!
ggmap
Tämä on kartoituspaketti, jota käytetään tilavisualisointien rajaamiseen. Se koostuu myös erilaisista työkaluista geopaikannukseen ja reititykseen.
glue
Kehittäjät tekivät tämän paketin datan käsittelyn suorittamista varten. Käytämme tätä pakettia merkkijonon sisällä olevien R-lausekkeiden arviointiin.
shiny
Shiny-paketin avulla voit kehittää interaktiivisia ja esteettisesti miellyttäviä verkkosovelluksia R:n avulla. Se tarjoaa myös erilaisia laajennuksia CSS:llä, HTML-vidgeteillä ja JavaScriptiä.
plotly
R-paketti ’plotly’ tarjoaa vuorovaikutteisia ja laadukkaita online-grafiikkoja. Se perustuu JavaScript-kirjastoon -plotly.js.
tidytext
Paketti tarjoaa erilaisia tekstinlouhinnan toimintoja tekstinkäsittelyyn ja tunneanalyysin suorittamiseen ’dplyr’n’, ’ggplot’n’ ja muiden sekalaisten työkalujen avulla.
Tutustu Data Science Project on Sentiment Analysis in R
stringr
Tämä paketti tarjoaa johdonmukaisia ja helppokäyttöisiä kääreitä ’stringi’ paketille, joka helpottaa yleisiä merkkijono-operaatioita.
reshape2
Tämä paketti helpottaa datan joustavaa uudelleenjärjestelyä ja aggregointia melt()- ja decast()-funktioiden avulla.
dichromat
R:n dichromat-paketin avulla voidaan poistaa väreistä puna-vihreä- tai sini-vihreä-kontrastit.
digest
Hyödynnämme digest-pakettia R-funktioiden kryptografisten hash-objektien luomiseen.
MASS
MASS tarjoaa suuren määrän tilastofunktioita. Se tarjoaa tietokokonaisuuksia, jotka ovat yhdessä kirjan ”Modern Applied Statistics with S” kanssa.
caret
Caret-paketti tarjoaa funktioita luokittelu- ja regressiotehtävien suorittamiseen. CaretEnsemble, caretin ominaisuus, on tarkoitettu eri mallien yhdistämiseen.
Sinun täytyy tietää luokittelusta R-ohjelmoinnissa ennen kuin jatkat eteenpäin
e1071
Tämä kirjasto tarjoaa hyödyllisiä funktioita, jotka ovat välttämättömiä data-analyysin kannalta, kuten Fourier-muunnokset, Naive Bayes, klusteroinnit, SVM:t ja muut sekalaiset funktiot.
sentimentr
Paketti tarjoaa funktioita sentimenttianalyysin suorittamiseen. Se laskee tekstin polariteetin lausetasolla ja suorittaa aggregaation riveittäin tai ryhmittelymuuttujien mukaan.
Yhteenveto
Yllä olevassa artikkelissa kävimme läpi listan suosituimmista paketeista R:ssä. Keskustelimme erilaisista kirjastoista, joita hyödynnämme datan käsittelyyn, analysointiin ja visualisointiin. R on jatkuvasti kehittyvä kieli, joka on luonut jalansijaa Data Science -alalla. Toivomme, että nautit tämän artikkelin lukemisesta. Jos jätimme mainitsematta jonkin tärkeäksi katsomasi paketin, muista kommentoida.
Seuraava vaihe R-opetussarjassamme DataFlair – Tilastotiede ja R-ohjelmointi