ML & AI

20 najboljših paketov R strojnega učenja, ki si jih lahko ogledate zdaj

20 najboljših paketov R strojnega učenja, ki si jih lahko ogledate zdaj

Skoraj vsi začetniki podatkov in raziskovalci strojnega učenja so zmedeni pri izbiri programskega jezika. Vedno se sprašujejo, kateri programski jezik bo najboljši za njihov projekt strojnega učenja in znanosti o podatkih. Ali se bomo odločili za python, R ali MatLab. No, izbira programskega jezika je odvisna od preferenc razvijalcev in sistemskih zahtev. Med drugimi programskimi jeziki je R eden najbolj potencialnih in čudovitih programskih jezikov, ki ima več paketov strojnega učenja R za projekte ML, AI in znanosti.

Posledično lahko s pomočjo teh R-paketov strojnega učenja svoj projekt razvijemo brez truda in učinkovitosti. Glede na raziskavo Kaggle je R eden najbolj priljubljenih odprtokodnih jezikov strojnega učenja.

Najboljši paketi strojnega učenja R


R je odprtokodni jezik, tako da lahko ljudje prispevajo od kjer koli na svetu. V svoji kodi lahko uporabite črno skrinjico, ki jo je napisal nekdo drug. V R je ta črna skrinjica označena kot paket. Paket ni nič drugega kot vnaprej napisana koda, ki jo lahko večkrat uporablja vsak. Spodaj predstavljamo 20 najboljših R-paketov strojnega učenja.

1. CARET


Paket CARET se nanaša na klasifikacijsko in regresijsko usposabljanje. Naloga tega paketa CARET je vključiti usposabljanje in napovedovanje modela. Je eden najboljših paketov R za strojno učenje in podatkovno znanost.

Parametre je mogoče iskati z integracijo več funkcij za izračun celotne učinkovitosti danega modela z uporabo metode iskanja po mreži v tem paketu. Po uspešnem zaključku vseh poskusov iskanje mrež končno najde najboljše kombinacije.

Po namestitvi tega paketa lahko razvijalec zažene imena (getModelInfo ()), da si ogleda 217 možnih funkcij, ki jih je mogoče zagnati samo z eno funkcijo. Za izdelavo napovednega modela paket CARET uporablja funkcijo train (). Sintaksa te funkcije:

vlak (formula, podatki, metoda)

Dokumentacija

2. randomForest


RandomForest je eden izmed najbolj priljubljenih R paketov za strojno učenje. Ta paket R strojnega učenja se lahko uporablja za reševanje regresijskih in klasifikacijskih nalog. Poleg tega se lahko uporablja za trening manjkajočih vrednosti in izstopajočih vrednosti.

Ta paket strojnega učenja z R se na splošno uporablja za generiranje številnih dreves odločitev. V bistvu vzame naključne vzorce. Nato so opazovanja dana v drevo odločanja. Končno je skupni rezultat, ki prihaja iz drevesa odločitev, končni rezultat. Sintaksa te funkcije:

randomForest (formula =, podatki =)

Dokumentacija

3. e1071


Ta e1071 je eden najpogosteje uporabljenih paketov R za strojno učenje. Z uporabo tega paketa lahko razvijalec implementira podporne vektorske stroje (SVM), izračun najkrajše poti, združevanje v vrečke, Naive Bayesov klasifikator, kratkoročno Fourierjevo transformacijo, mehko združevanje itd.

Sintaksa SVM za podatke IRIS je na primer:

svm (Vrste ~ Sepal.Dolžina + Sepal.Širina, podatki = šarenica)

Dokumentacija

4. Rpart


Rpart pomeni rekurzivni trening particioniranja in regresije. Ta paket R za strojno učenje lahko opravlja obe nalogi: klasifikacijo in regresijo. Deluje z dvostopenjskim korakom. Izhodni model binarnega drevesa. Funkcija plot () se uporablja za risanje izhodnega rezultata. Obstaja tudi alternativna funkcija, funkcija prp (), ki je prožnejša in zmogljivejša od osnovne funkcije plot ().

Funkcija rpart () se uporablja za vzpostavitev povezave med neodvisnimi in odvisnimi spremenljivkami. Sintaksa je:

rpart (formula, podatki =, metoda =, nadzor =)

kjer je formula kombinacija neodvisnih in odvisnih spremenljivk, podatki so ime nabora podatkov, metoda je cilj in nadzor je vaša sistemska zahteva.

Dokumentacija

5. KernLab


Če želite svoj projekt razviti na osnovi jedrnih algoritmov strojnega učenja, lahko ta paket R uporabite za strojno učenje. Ta paket se uporablja za SVM, analizo lastnosti jedra, algoritem za razvrščanje, primitivne točke pik, Gaussov postopek in še veliko več. KernLab se pogosto uporablja za izvedbe SVM.

Na voljo so različne funkcije jedra. Tu so omenjene nekatere funkcije jedra: polydot (polinomska funkcija jedra), tanhdot (hiperbolična tangentna funkcija jedra), laplacedot (laplacijeva funkcija jedra) itd. Te funkcije se uporabljajo za izvajanje težav s prepoznavanjem vzorcev. Toda uporabniki lahko uporabljajo svoje funkcije jedra namesto vnaprej določenih funkcij jedra.

Dokumentacija

6. nnet


Če želite razviti aplikacijo za strojno učenje z uporabo umetne nevronske mreže (ANN), vam bo ta nnet paket morda v pomoč. Je eden najbolj priljubljenih in enostavnih izvedbenih paketov nevronskih mrež. Toda omejitev je, da gre za eno plast vozlišč.

Sintaksa tega paketa je:

nnet (formula, podatki, velikost)

Dokumentacija

7. dplyr


Eden najpogosteje uporabljenih paketov R za podatkovno znanost. Zagotavlja tudi nekaj enostavnih, hitrih in doslednih funkcij za obdelavo podatkov. Hadley Wickham piše ta r programski paket za podatkovno znanost. Ta paket je sestavljen iz nabora glagolov i.e., mutirajte (), izberite (), filtrirajte (), povzemite () in uredite ().

Če želite namestiti ta paket, morate napisati to kodo:

namestite.paketi (“dplyr”)

In da naložite ta paket, morate napisati to sintakso:

knjižnica (dplyr)

Dokumentacija

8. ggplot2


Še en izmed najbolj elegantnih in estetskih grafičnih paketov R za podatkovno znanost je ggplot2. Gre za sistem ustvarjanja grafike, ki temelji na slovnici grafike. Sintaksa namestitve za ta paket znanosti o znanosti je:

namestite.paketi (“ggplot2”)

Dokumentacija

9. Wordcloud


Ko je ena slika sestavljena iz tisoč besed, se imenuje Wordcloud. V bistvu gre za vizualizacijo besedilnih podatkov. Ta paket strojnega učenja z uporabo R se uporablja za ustvarjanje predstavitve besed, razvijalec pa lahko prilagodi Wordcloud glede na svoje želje, na primer razporeditev besed naključno ali besed z enako frekvenco skupaj ali visokofrekvenčnih besed v sredini itd.

V jeziku strojnega učenja R sta na voljo dve knjižnici za ustvarjanje wordcloud: Wordcloud in Worldcloud2. Tu bomo prikazali sintakso za WordCloud2. Če želite namestiti WordCloud2, morate napisati:

1. zahtevaj (devtools)
2. install_github (“lchiffon / wordcloud2”)

Lahko pa ga uporabite tudi neposredno:

knjižnica (wordcloud2)

Dokumentacija

10. urejen


Še en pogosto uporabljen paket r za podatkovno znanost je tidyr. Cilj tega r programiranja za podatkovno znanost je pospravljanje podatkov. Pri urejenosti je spremenljivka postavljena v stolpec, opazovanje je postavljeno v vrstico in vrednost je v celici. Ta paket opisuje standardni način razvrščanja podatkov.

Za namestitev lahko uporabite ta fragment kode:

namestite.paketi (“tidyr”)

Za nalaganje je koda:

knjižnica (urejeno)

Dokumentacija

11. sijoča


Paket R, Shiny, je eden od okvirov spletnih aplikacij za znanost o podatkih. Pomaga pri enostavno ustvarjanju spletnih aplikacij iz R-ja. Razvijalec lahko programsko opremo namesti v vsak odjemalski sistem ali pa kabina gosti spletno stran. Razvijalec lahko tudi izdela nadzorne plošče ali jih vdela v dokumente R Markdown.

Poleg tega lahko Shiny aplikacije razširite z različnimi skriptnimi jeziki, kot so gradniki html, teme CSS in dejanja JavaScript. Z eno besedo lahko rečemo, da je ta paket kombinacija računske moči R z interaktivnostjo sodobnega spleta.

Dokumentacija

12. tm


Ni treba posebej poudarjati, da je danes rudarjenje besedil nova aplikacija strojnega učenja. Ta paket R strojnega učenja nudi okvir za reševanje nalog rudarjenja besedil. V aplikaciji za besedilno rudarjenje, tj.e., analizi sentimenta ali klasifikaciji novic razvijalec izvaja različne vrste dolgočasnega dela, kot so odstranjevanje neželenih in nepomembnih besed, odstranjevanje ločil, odstranjevanje zaustavitvenih besed in še veliko več.

Paket tm vsebuje več prilagodljivih funkcij za lažje delo, na primer removeNumbers (): odstranitev števil iz danega besedilnega dokumenta, weightTfIdf (): za izraz Frekvenca in obratna frekvenca dokumenta, tm_reduce (): za kombiniranje transformacij, removePunctuation () za odstranite ločila iz danega besedilnega dokumenta in še veliko več.

Dokumentacija

13. Paket MICE


Paket strojnega učenja z R, MICE se nanaša na multivariatno imputacijo prek verižnih zaporedij. Skoraj ves čas se razvijalec projekta sooča s skupno težavo z naborom podatkov o strojnem učenju, ki je manjkajoča vrednost. Ta paket lahko uporabite za pripisovanje manjkajočih vrednosti z več tehnikami.

Ta paket vsebuje več funkcij, kot so pregledovanje vzorcev manjkajočih podatkov, diagnosticiranje kakovosti pripisanih vrednosti, analiziranje dokončanih podatkovnih nizov, shranjevanje in izvoz imputiranih podatkov v različnih oblikah in še veliko več.

Dokumentacija

14. igraph


Paket mrežne analize, igraph, je eden najmočnejših R-paketov za podatkovno znanost. Gre za zbirko zmogljivih, učinkovitih, enostavnih za uporabo in prenosnih orodij za analizo omrežja. Ta paket je tudi odprtokoden in brezplačen. Poleg tega lahko igraphn programirate na Python, C / C ++ in Mathematica.

Ta paket ima več funkcij za generiranje naključnih in pravilnih grafov, vizualizacijo grafa itd. S tem paketom R lahko delate tudi z velikim grafom. Za uporabo tega paketa obstaja nekaj zahtev: za Linux sta potrebna prevajalnik C in C ++.

Namestitev tega programskega paketa R za znanost o podatkih je:

namestite.paketi ("igraph")

Za nalaganje tega paketa morate napisati:

knjižnica (igraph)

Dokumentacija

15. ROCR


Paket R za znanost o podatkih, ROCR, se uporablja za vizualizacijo delovanja klasifikatorjev točkovanja. Ta paket je prilagodljiv in enostaven za uporabo. Potrebni so le trije ukazi in privzete vrednosti za neobvezne parametre. Ta paket se uporablja za razvijanje 2D krivulj parametrizirane zmogljivosti. V tem paketu obstaja več funkcij, kot so napoved (), ki se uporabljajo za ustvarjanje predmetov predvidevanja, zmogljivost (), ki se uporabljajo za ustvarjanje predmetov uspešnosti itd.

Dokumentacija

16. DataExplorer


Paket DataExplorer je eden najpogosteje enostavnih R-paketov za podatkovno znanost. Med številnimi nalogami na področju znanosti o podatkih je med njimi tudi raziskovalna analiza podatkov (EDA). Pri raziskovalni analizi podatkov mora biti analitik podatkov bolj pozoren na podatke. Ročno preverjanje ali obdelava podatkov ali uporaba slabega kodiranja ni lahka naloga. Potrebna je avtomatizacija analize podatkov.

Ta paket R za znanost o podatkih zagotavlja avtomatizacijo raziskovanja podatkov. Ta paket se uporablja za skeniranje in analizo vsake spremenljivke ter njihovo vizualizacijo. Uporabno je, če je nabor podatkov velik. Analiza podatkov torej lahko učinkovito in brez truda pridobi skrivno znanje o podatkih.

Paket lahko namestite iz programa CRAN neposredno s spodnjo kodo:

namestite.paketov (»DataExplorer«)

Če želite naložiti ta paket R, morate napisati:

knjižnica (DataExplorer)

Dokumentacija

17. mlr


Eden najbolj neverjetnih paketov strojnega učenja R je paket mlr. Ta paket je šifriranje več nalog strojnega učenja. To pomeni, da lahko več nalog opravite samo z enim paketom, za tri različne naloge pa vam ni treba uporabiti treh paketov.

Paket mlr je vmesnik za številne tehnike razvrščanja in regresije. Tehnike vključujejo strojno berljive opise parametrov, združevanje v skupine, generično ponovno vzorčenje, filtriranje, ekstrakcijo funkcij in še veliko več. Prav tako je mogoče izvajati vzporedne operacije.

Za namestitev morate uporabiti spodnjo kodo:

namestite.pakiranja („mlr“)

Če želite naložiti ta paket:

knjižnica (mlr)

Dokumentacija

18. rule


Paket, ki je v skladu s pravili (Pravila združenja rudarjenja in pogosti nabori predmetov), ​​je široko uporabljen paket strojnega učenja R. Z uporabo tega paketa lahko izvedemo več operacij. Operacije so predstavitev in analiza transakcij podatkov in vzorcev ter manipulacija s podatki. Na voljo so tudi C izvedbe algoritmov rudarjenja Apriori in Eclat.

Dokumentacija

19. mboost


Drug paket R strojnega učenja za podatkovno znanost je mboost. Ta paket, ki temelji na modelu, ima funkcionalni algoritem za spust gradienta za optimizacijo splošnih funkcij tveganja z uporabo regresijskih dreves ali ocen najmanjših kvadratov po komponentah. Zagotavlja tudi model interakcije s potencialno visoko dimenzionalnimi podatki.

Dokumentacija

20. zabava


Drugi paket strojnega učenja z R je zabava. To računsko orodje se uporablja za rekurzivno particioniranje. Glavna funkcija ali jedro tega paketa strojnega učenja je ctree (). Je široko uporabljena funkcija, ki skrajša čas treninga in pristranskost.

Sintaksa ctree () je:

 ctree (formula, podatki)

Dokumentacija

Konec misli


R je tako ugleden programski jezik, ki za raziskovanje podatkov uporablja statistične metode in grafe. Ni treba posebej poudarjati, da ima ta jezik več paketov R strojnega učenja, neverjetno orodje RStudio in enostavno razumljivo sintakso za razvoj naprednih projektov strojnega učenja. V embalaži R ml je nekaj privzetih vrednosti. Preden ga uporabite v svojem programu, morate podrobno poznati različne možnosti. Z uporabo teh paketov strojnega učenja lahko vsak ustvari učinkovit model strojnega učenja ali podatkovnih znanosti. Nazadnje je R odprtokodni jezik in njegovi paketi nenehno rastejo.

Če imate kakršne koli predloge ali vprašanja, pustite komentar v našem oddelku za komentarje. Ta članek lahko prek družabnih omrežij delite tudi s prijatelji in družino.

Bitka za Wesnoth 1.13.6 Razvoj izdan
Bitka za Wesnoth 1.13.6, ki je izšel prejšnji mesec, je šesta razvojna izdaja v 1.13.x series in prinaša številne izboljšave, predvsem uporabniški vme...
Kako namestiti League Of Legends na Ubuntu 14.04
Če ste ljubitelj League of Legends, je to priložnost, da preizkusite League of Legends. Upoštevajte, da LOL podpira PlayOnLinux, če uporabljate Linux....
Namestite najnovejšo strategijo igre OpenRA v Ubuntu Linux
OpenRA je Libre / Free Real Time strateški stroj, ki poustvarja zgodnje igre Westwood, kot je klasična Command & Conquer: Red Alert. Porazdeljeni modi...