Kaj je najboljša grafična kartica za poglobljeno učenje?

Če so CPU možgani računalnika, potem je GPU duša. Čeprav lahko večina osebnih računalnikov deluje brez dobrega grafičnega procesorja, poglobljeno učenje brez njega ni mogoče. To je zato, ker globoko učenje zahteva zapletene operacije, kot so manipulacija z matrico, izjemni računski predpogoji in znatna računalniška moč.

Izkušnje so ključne za razvijanje veščin, potrebnih za globoko učenje pri novih vprašanjih. Hiter GPU pomeni takojšen pridobitev praktičnih izkušenj s takojšnjo povratno informacijo. GPU vsebujejo več jeder za obravnavo vzporednih izračunov. Vključujejo tudi obsežno pomnilniško pasovno širino za enostavno upravljanje s temi informacijami.

Naša najboljša priporočena izbira za najboljšo grafično kartico za globoko učenje je Nvidia Geforce RTX 2080 Founders Edition. Kupite ga zdaj za 1.940 USD na Amazonu

S tem v mislih želimo odgovoriti na vprašanje: »Katera je najboljša grafična kartica za umetno inteligenco, strojno učenje in globoko učenje?"S pregledom več grafičnih kartic, ki so trenutno na voljo leta 2021. Pregledane kartice:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Spodaj so rezultati:

AMD RX Vega 64

Radeon RX Vega 64

Lastnosti

Datum izdaje: 14. avgust 2017
Vega Arhitektura
Vmesnik PCI Express
Taktna hitrost: 1247 MHz
Pretočni procesorji: 4096
VRAM: 8 GB
Pasovna širina pomnilnika: 484 GB / s

Pregled

Če vam niso všeč grafični procesorji NVIDIA ali vam proračun ne omogoča, da za grafično kartico zapravite do 500 USD, ima AMD pametno alternativo. AMD-jeva RS Vega 64 je zelo težko prezreti, saj je v njej dostojna količina RAM-a, hitra pasovna širina in več kot dovolj pretočnih procesorjev.

Arhitektura Vega je nadgradnja prejšnjih kartic RX. Po zmogljivosti je ta model blizu GeForce RTX 1080 Ti, saj imata oba modela podoben VRAM. Poleg tega Vega podpira izvorno poltočnost (FP16). ROCm in TensorFlow delujeta, vendar programska oprema ni tako zrela kot pri grafičnih karticah NVIDIA.

Vse skupaj je Vega 64 spodoben grafični procesor za globoko učenje in umetno inteligenco. Ta model stane precej pod 500 USD in opravi delo za začetnike. Za profesionalne aplikacije pa priporočamo, da se odločite za kartico NVIDIA.

AMD RX Vega 64 Podrobnosti: Amazon

NVIDIA Tesla V100

Tesla V100

Lastnosti:

Datum izdaje: 7. december 2017
Arhitektura NVIDIA Volta
Vmesnik PCI-E
112 TFLOPS Tensor Performance
640 tenzorskih jeder
5120 Jedra NVIDIA CUDA®
VRAM: 16 GB
Pasovna širina pomnilnika: 900 GB / s
Računalniški API-ji: CUDA, DirectCompute, OpenCL ™, OpenACC®

Pregled:

NVIDIA Tesla V100 je neverjetna in ena najboljših grafičnih kartic za umetno inteligenco, strojno učenje in globoko učenje. Ta kartica je popolnoma optimizirana in je opremljena z vsemi dobrotami, ki jih morda potrebujete za ta namen.

Tesla V100 je na voljo v 16 GB in 32 GB konfiguraciji pomnilnika. Z obilico VRAM-a, pospeševanjem umetne inteligence, visoko pasovno širino pomnilnika in specializiranimi tenzorskimi jedri za globoko učenje ste lahko prepričani, da bo vsak vaš model treninga potekal gladko - in v krajšem času. Natančneje, Tesla V100 lahko zagotovi 125TFLOPS zmogljivosti globokega učenja tako za usposabljanje kot sklepanje [3], kar omogoča NVIDIA-ina arhitektura Volta.

Podrobnosti o NVIDIA Tesla V100: Amazon, (1)

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Lastnosti:

Datum izdaje: avgust 2018
Turingova arhitektura
576 tenzorskih jeder
Jedra CUDA: 4.608
VRAM: 48 GB
Pasovna širina pomnilnika: 672 GB / s
16.3 TFLOPS
Sistemski vmesnik: PCI-Express

Pregled:

Quadro RTX 8000 je posebej zasnovan za aritmetiko in računske matrike globokega učenja in je vrhunska grafična kartica. Ker ima ta kartica veliko zmogljivost VRAM (48 GB), je ta model priporočljiv za raziskovanje zelo velikih računskih modelov. Če se uporablja v paru z NVLink, se lahko zmogljivost poveča na do 96 GB VRAM-a. Kar je veliko!

Kombinacija 72 RT in 576 Tensor jeder za izboljšane delovne tokove povzroči več kot 130 TFLOPS zmogljivosti. V primerjavi z najdražjo grafično kartico na našem seznamu - Teslo V100 - ta model potencialno ponuja 50 odstotkov več pomnilnika in še vedno stane manj. Tudi pri nameščenem pomnilniku ima ta model izjemno zmogljivost pri delu z večjimi velikostmi serij na enem GPU.

Tudi pri Tesli V100 je tudi ta model omejen samo z vašo cenovno streho. Če želite vlagati v prihodnost in v visokokakovostno računalništvo, si priskrbite RTX 8000. Kdo ve, morda boste vodili raziskavo o AI. Tesla V100 temelji na arhitekturi Turinga, kjer V100 temelji na arhitekturi Volta, zato lahko Nvidia Quadro RTX 8000 velja za nekoliko modernejšo in nekoliko močnejšo od V100.

Nvidia Quadro RTX 8000 Podrobnosti: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 Founders Edition

Lastnosti:

Datum izdaje: 20. september 2018
Arhitektura Turing GPU in platforma RTX
Taktna hitrost: 1350 MHz
Jedra CUDA: 4352
11 GB ultra hitrega pomnilnika GDDR6 naslednje generacije
Pasovna širina pomnilnika: 616 GB / s
Moč: 260W

Pregled:

GeForce RTX 2080 Ti je proračunska možnost, ki je idealna za manjše modeliranje delovnih obremenitev in ne za obsežne treninge. To pa zato, ker ima na kartico manjši pomnilnik GPU (le 11 GB). Omejitve tega modela postanejo bolj očitne pri usposabljanju nekaterih sodobnih modelov NLP. Vendar to ne pomeni, da ta karta ne more tekmovati. Zasnova puhala na RTX 2080 omogoča precej gostejše konfiguracije sistema - do štiri grafične procesorje v eni sami delovni postaji. Poleg tega ta model trenira nevronske mreže pri 80-odstotni hitrosti Tesle V100. Glede na merila uspešnosti globokega učenja LambdaLabs RTX 2080 v primerjavi s Teslo V100 dosega 73% hitrosti FP2 in 55% hitrosti FP16.

Medtem ta model stane skoraj sedemkrat manj kot Tesla V100. Tako s stališča cene kot zmogljivosti je GeForce RTX 2080 Ti odličen grafični procesor za globoko učenje in razvoj umetne inteligence.

GeForce RTX 2080 Ti Podrobnosti: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX Graphics

Lastnosti:

Datum izdaje: 18. december 2018
Poganja arhitektura NVIDIA Turing ™, zasnovana za umetno inteligenco
576 tenzorskih jeder za pospeševanje umetne inteligence
130 teraFLOPS (TFLOPS) za globoko učenje
Jedra CUDA: 4608
VRAM: 24 GB
Pasovna širina pomnilnika: 672 GB / s
Priporočeno napajanje 650 vatov

Pregled:

NVIDIA Titan RTX je še en GPU srednjega razreda, ki se uporablja za kompleksne operacije globokega učenja. 24 GB VRAM-a tega modela je dovolj za delo z večino serij. Če želite trenirati večje modele, pa to kartico povežite z mostom NVLink, da boste dejansko imeli 48 GB VRAM-a. Ta znesek bi zadostoval tudi za velike transformatorske modele NLP. Poleg tega Titan RTX omogoča vadbo z natančno mešano natančnostjo za modele (tj.e., FP 16 skupaj s kopičenjem FP32). Kot rezultat, ta model deluje približno 15 do 20 odstotkov hitreje pri operacijah, kjer se uporabljajo jedra Tensor.

Ena omejitev NVIDIA Titan RTX je zasnova dvojnega ventilatorja. To ovira bolj zapletene sistemske konfiguracije, ker jih ni mogoče spakirati na delovno postajo brez bistvenih sprememb hladilnega mehanizma, kar ni priporočljivo.

Na splošno je Titan odličen, večnamenski grafični procesor za skoraj vsako globoko učno nalogo. V primerjavi z drugimi grafičnimi karticami za splošno uporabo je zagotovo draga. Zato ta model ni priporočljiv za igralce iger. Kljub temu bi raziskovalci, ki uporabljajo zapletene modele globokega učenja, verjetno cenili dodaten VRAM in povečanje zmogljivosti. Cena Titan RTX je bistveno nižja od zgoraj predstavljene V100 in bi bila dobra izbira, če vaš proračun ne omogoča globokega učenja za cene V100 ali če vaša delovna obremenitev ne potrebuje več kot Titan RTX (glejte zanimiva merila uspešnosti)

NVIDIA Titan RTX Podrobnosti: Amazon

Izbira najboljše grafične kartice za umetno inteligenco, strojno učenje in globoko učenje

AI, strojno učenje in naloge globokega učenja obdelujejo kup podatkov. Ta opravila so lahko zelo zahtevna za vašo strojno opremo. Spodaj so navedene funkcije, ki jih je treba upoštevati pred nakupom grafičnega procesorja.

Jedra

Kot preprosto preprosto pravilo je, da večje je število jeder, večja bo zmogljivost vašega sistema. Upoštevati je treba tudi število jeder, zlasti če imate veliko podatkov. NVIDIA je svoja jedra poimenovala CUDA, AMD pa njihova jedra imenuje stream procesorji. Poiščite največje število procesorskih jeder, ki vam jih bo omogočil proračun.

Procesorska moč

Procesorska moč grafičnega procesorja je odvisna od števila jeder v sistemu, pomnoženega s taktnimi hitrostmi, pri katerih izvajate jedra. Višja kot je hitrost in večje je število jeder, večja bo procesorska moč, s katero lahko vaš GPU izračuna podatke. To tudi določa, kako hitro bo vaš sistem opravil nalogo.

VRAM

Video RAM ali VRAM je merjenje količine podatkov, ki jih lahko vaš sistem obdela naenkrat. Višji VRAM je ključnega pomena, če delate z različnimi modeli Computer Vision ali izvajate tekmovanja CV Kaggle. VRAM ni tako pomemben za NLP ali za delo z drugimi kategoričnimi podatki.

Pasovna širina pomnilnika

Pasovna širina pomnilnika je hitrost, s katero se podatki preberejo ali shranijo v pomnilnik. Preprosto povedano, to je hitrost VRAM-a. Izmerjeno v GB / s, večja pasovna širina pomnilnika pomeni, da lahko kartica v manj časa potegne več podatkov, kar pomeni hitrejše delovanje.

Hlajenje

Temperatura grafičnega procesorja je lahko pomembno ozko grlo pri zmogljivosti. Sodobni grafični procesorji med izvajanjem algoritma povečajo svojo hitrost do maksimuma. Toda takoj, ko je dosežen določen temperaturni prag, GPU zmanjša hitrost obdelave, da se zaščiti pred pregrevanjem.

Zasnova ventilatorja ventilatorja za zračne hladilnike potiska zrak zunaj sistema, medtem ko ventilatorji, ki ne puhajo, sesajo zrak. V arhitekturi, kjer je več grafičnih procesorjev nameščenih drug ob drugem, se ventilatorji, ki ne puhajo, bolj segrejejo. Če uporabljate zračno hlajenje v nastavitvah s 3 do 4 grafičnimi procesorji, se izogibajte nepihalnim ventilatorjem.

Druga možnost je vodno hlajenje. Čeprav je draga, je ta metoda veliko bolj tiha in zagotavlja, da tudi najkvalitetnejše nastavitve GPU ostanejo hladne med celotnim delovanjem.

Zaključek

Za večino uporabnikov, ki se potrudijo v globoko učenje, bosta RTX 2080 Ti ali Titan RTX zagotovila največji zaslužek za vaš denar. Edina pomanjkljivost RTX 2080 Ti je omejena velikost 11 GB VRAM-a. Vadba z večjimi velikostmi serij omogoča modelom, da trenirajo hitreje in veliko natančneje ter tako prihranijo veliko časa uporabnika. To je mogoče le, če imate Quadro GPU ali TITAN RTX. Uporaba polovične natančnosti (FP16) omogoča, da se modeli prilegajo grafičnim procesorjem z nezadostno velikostjo VRAM-a [2]. Za naprednejše uporabnike pa bi morali vložiti Tesla V100. To je naša najboljša izbira za najboljšo grafično kartico za umetno inteligenco, strojno učenje in globoko učenje. To je vse za ta članek. Upamo, da vam je bilo všeč. Do naslednjič!

Reference

Najboljši grafični procesorji za umetno inteligenco, strojno učenje in poglobljeno učenje v letu 2020
Najboljši grafični procesor za globoko učenje v letu 2020
NVIDIA AI INFERENCE PLATFORM: Ogromen preskok v zmogljivosti in učinkovitosti storitev AI, od podatkovnega centra do roba omrežja
Grafični procesor NVIDIA V100 TENSOR CORE
Merila globokega učenja Titan RTX