Izkušnje so ključne za razvijanje veščin, potrebnih za globoko učenje pri novih vprašanjih. Hiter GPU pomeni takojšen pridobitev praktičnih izkušenj s takojšnjo povratno informacijo. GPU vsebujejo več jeder za obravnavo vzporednih izračunov. Vključujejo tudi obsežno pomnilniško pasovno širino za enostavno upravljanje s temi informacijami.
S tem v mislih želimo odgovoriti na vprašanje: »Katera je najboljša grafična kartica za umetno inteligenco, strojno učenje in globoko učenje?"S pregledom več grafičnih kartic, ki so trenutno na voljo leta 2021. Pregledane kartice:
- AMD RX Vega 64
- NVIDIA Tesla V100
- Nvidia Quadro RTX 8000
- GeForce RTX 2080 Ti
- NVIDIA Titan RTX
Spodaj so rezultati:
AMD RX Vega 64
Radeon RX Vega 64
Lastnosti
- Datum izdaje: 14. avgust 2017
- Vega Arhitektura
- Vmesnik PCI Express
- Taktna hitrost: 1247 MHz
- Pretočni procesorji: 4096
- VRAM: 8 GB
- Pasovna širina pomnilnika: 484 GB / s
Pregled
Če vam niso všeč grafični procesorji NVIDIA ali vam proračun ne omogoča, da za grafično kartico zapravite do 500 USD, ima AMD pametno alternativo. AMD-jeva RS Vega 64 je zelo težko prezreti, saj je v njej dostojna količina RAM-a, hitra pasovna širina in več kot dovolj pretočnih procesorjev.
Arhitektura Vega je nadgradnja prejšnjih kartic RX. Po zmogljivosti je ta model blizu GeForce RTX 1080 Ti, saj imata oba modela podoben VRAM. Poleg tega Vega podpira izvorno poltočnost (FP16). ROCm in TensorFlow delujeta, vendar programska oprema ni tako zrela kot pri grafičnih karticah NVIDIA.
Vse skupaj je Vega 64 spodoben grafični procesor za globoko učenje in umetno inteligenco. Ta model stane precej pod 500 USD in opravi delo za začetnike. Za profesionalne aplikacije pa priporočamo, da se odločite za kartico NVIDIA.
AMD RX Vega 64 Podrobnosti: Amazon
NVIDIA Tesla V100
Tesla V100
Lastnosti:
- Datum izdaje: 7. december 2017
- Arhitektura NVIDIA Volta
- Vmesnik PCI-E
- 112 TFLOPS Tensor Performance
- 640 tenzorskih jeder
- 5120 Jedra NVIDIA CUDA®
- VRAM: 16 GB
- Pasovna širina pomnilnika: 900 GB / s
- Računalniški API-ji: CUDA, DirectCompute, OpenCL ™, OpenACC®
Pregled:
NVIDIA Tesla V100 je neverjetna in ena najboljših grafičnih kartic za umetno inteligenco, strojno učenje in globoko učenje. Ta kartica je popolnoma optimizirana in je opremljena z vsemi dobrotami, ki jih morda potrebujete za ta namen.
Tesla V100 je na voljo v 16 GB in 32 GB konfiguraciji pomnilnika. Z obilico VRAM-a, pospeševanjem umetne inteligence, visoko pasovno širino pomnilnika in specializiranimi tenzorskimi jedri za globoko učenje ste lahko prepričani, da bo vsak vaš model treninga potekal gladko - in v krajšem času. Natančneje, Tesla V100 lahko zagotovi 125TFLOPS zmogljivosti globokega učenja tako za usposabljanje kot sklepanje [3], kar omogoča NVIDIA-ina arhitektura Volta.
Podrobnosti o NVIDIA Tesla V100: Amazon, (1)
Nvidia Quadro RTX 8000
Nvidia Quadro Rtx 8000
Lastnosti:
- Datum izdaje: avgust 2018
- Turingova arhitektura
- 576 tenzorskih jeder
- Jedra CUDA: 4.608
- VRAM: 48 GB
- Pasovna širina pomnilnika: 672 GB / s
- 16.3 TFLOPS
- Sistemski vmesnik: PCI-Express
Pregled:
Quadro RTX 8000 je posebej zasnovan za aritmetiko in računske matrike globokega učenja in je vrhunska grafična kartica. Ker ima ta kartica veliko zmogljivost VRAM (48 GB), je ta model priporočljiv za raziskovanje zelo velikih računskih modelov. Če se uporablja v paru z NVLink, se lahko zmogljivost poveča na do 96 GB VRAM-a. Kar je veliko!
Kombinacija 72 RT in 576 Tensor jeder za izboljšane delovne tokove povzroči več kot 130 TFLOPS zmogljivosti. V primerjavi z najdražjo grafično kartico na našem seznamu - Teslo V100 - ta model potencialno ponuja 50 odstotkov več pomnilnika in še vedno stane manj. Tudi pri nameščenem pomnilniku ima ta model izjemno zmogljivost pri delu z večjimi velikostmi serij na enem GPU.
Tudi pri Tesli V100 je tudi ta model omejen samo z vašo cenovno streho. Če želite vlagati v prihodnost in v visokokakovostno računalništvo, si priskrbite RTX 8000. Kdo ve, morda boste vodili raziskavo o AI. Tesla V100 temelji na arhitekturi Turinga, kjer V100 temelji na arhitekturi Volta, zato lahko Nvidia Quadro RTX 8000 velja za nekoliko modernejšo in nekoliko močnejšo od V100.
Nvidia Quadro RTX 8000 Podrobnosti: Amazon
GeForce RTX 2080 Ti
Geforce RTX 2080 Founders Edition
Lastnosti:
- Datum izdaje: 20. september 2018
- Arhitektura Turing GPU in platforma RTX
- Taktna hitrost: 1350 MHz
- Jedra CUDA: 4352
- 11 GB ultra hitrega pomnilnika GDDR6 naslednje generacije
- Pasovna širina pomnilnika: 616 GB / s
- Moč: 260W
Pregled:
GeForce RTX 2080 Ti je proračunska možnost, ki je idealna za manjše modeliranje delovnih obremenitev in ne za obsežne treninge. To pa zato, ker ima na kartico manjši pomnilnik GPU (le 11 GB). Omejitve tega modela postanejo bolj očitne pri usposabljanju nekaterih sodobnih modelov NLP. Vendar to ne pomeni, da ta karta ne more tekmovati. Zasnova puhala na RTX 2080 omogoča precej gostejše konfiguracije sistema - do štiri grafične procesorje v eni sami delovni postaji. Poleg tega ta model trenira nevronske mreže pri 80-odstotni hitrosti Tesle V100. Glede na merila uspešnosti globokega učenja LambdaLabs RTX 2080 v primerjavi s Teslo V100 dosega 73% hitrosti FP2 in 55% hitrosti FP16.
Medtem ta model stane skoraj sedemkrat manj kot Tesla V100. Tako s stališča cene kot zmogljivosti je GeForce RTX 2080 Ti odličen grafični procesor za globoko učenje in razvoj umetne inteligence.
GeForce RTX 2080 Ti Podrobnosti: Amazon
NVIDIA Titan RTX
NVIDIA Titan RTX Graphics
Lastnosti:
- Datum izdaje: 18. december 2018
- Poganja arhitektura NVIDIA Turing ™, zasnovana za umetno inteligenco
- 576 tenzorskih jeder za pospeševanje umetne inteligence
- 130 teraFLOPS (TFLOPS) za globoko učenje
- Jedra CUDA: 4608
- VRAM: 24 GB
- Pasovna širina pomnilnika: 672 GB / s
- Priporočeno napajanje 650 vatov
Pregled:
NVIDIA Titan RTX je še en GPU srednjega razreda, ki se uporablja za kompleksne operacije globokega učenja. 24 GB VRAM-a tega modela je dovolj za delo z večino serij. Če želite trenirati večje modele, pa to kartico povežite z mostom NVLink, da boste dejansko imeli 48 GB VRAM-a. Ta znesek bi zadostoval tudi za velike transformatorske modele NLP. Poleg tega Titan RTX omogoča vadbo z natančno mešano natančnostjo za modele (tj.e., FP 16 skupaj s kopičenjem FP32). Kot rezultat, ta model deluje približno 15 do 20 odstotkov hitreje pri operacijah, kjer se uporabljajo jedra Tensor.
Ena omejitev NVIDIA Titan RTX je zasnova dvojnega ventilatorja. To ovira bolj zapletene sistemske konfiguracije, ker jih ni mogoče spakirati na delovno postajo brez bistvenih sprememb hladilnega mehanizma, kar ni priporočljivo.
Na splošno je Titan odličen, večnamenski grafični procesor za skoraj vsako globoko učno nalogo. V primerjavi z drugimi grafičnimi karticami za splošno uporabo je zagotovo draga. Zato ta model ni priporočljiv za igralce iger. Kljub temu bi raziskovalci, ki uporabljajo zapletene modele globokega učenja, verjetno cenili dodaten VRAM in povečanje zmogljivosti. Cena Titan RTX je bistveno nižja od zgoraj predstavljene V100 in bi bila dobra izbira, če vaš proračun ne omogoča globokega učenja za cene V100 ali če vaša delovna obremenitev ne potrebuje več kot Titan RTX (glejte zanimiva merila uspešnosti)
NVIDIA Titan RTX Podrobnosti: Amazon
Izbira najboljše grafične kartice za umetno inteligenco, strojno učenje in globoko učenje
AI, strojno učenje in naloge globokega učenja obdelujejo kup podatkov. Ta opravila so lahko zelo zahtevna za vašo strojno opremo. Spodaj so navedene funkcije, ki jih je treba upoštevati pred nakupom grafičnega procesorja.
Jedra
Kot preprosto preprosto pravilo je, da večje je število jeder, večja bo zmogljivost vašega sistema. Upoštevati je treba tudi število jeder, zlasti če imate veliko podatkov. NVIDIA je svoja jedra poimenovala CUDA, AMD pa njihova jedra imenuje stream procesorji. Poiščite največje število procesorskih jeder, ki vam jih bo omogočil proračun.
Procesorska moč
Procesorska moč grafičnega procesorja je odvisna od števila jeder v sistemu, pomnoženega s taktnimi hitrostmi, pri katerih izvajate jedra. Višja kot je hitrost in večje je število jeder, večja bo procesorska moč, s katero lahko vaš GPU izračuna podatke. To tudi določa, kako hitro bo vaš sistem opravil nalogo.
VRAM
Video RAM ali VRAM je merjenje količine podatkov, ki jih lahko vaš sistem obdela naenkrat. Višji VRAM je ključnega pomena, če delate z različnimi modeli Computer Vision ali izvajate tekmovanja CV Kaggle. VRAM ni tako pomemben za NLP ali za delo z drugimi kategoričnimi podatki.
Pasovna širina pomnilnika
Pasovna širina pomnilnika je hitrost, s katero se podatki preberejo ali shranijo v pomnilnik. Preprosto povedano, to je hitrost VRAM-a. Izmerjeno v GB / s, večja pasovna širina pomnilnika pomeni, da lahko kartica v manj časa potegne več podatkov, kar pomeni hitrejše delovanje.
Hlajenje
Temperatura grafičnega procesorja je lahko pomembno ozko grlo pri zmogljivosti. Sodobni grafični procesorji med izvajanjem algoritma povečajo svojo hitrost do maksimuma. Toda takoj, ko je dosežen določen temperaturni prag, GPU zmanjša hitrost obdelave, da se zaščiti pred pregrevanjem.
Zasnova ventilatorja ventilatorja za zračne hladilnike potiska zrak zunaj sistema, medtem ko ventilatorji, ki ne puhajo, sesajo zrak. V arhitekturi, kjer je več grafičnih procesorjev nameščenih drug ob drugem, se ventilatorji, ki ne puhajo, bolj segrejejo. Če uporabljate zračno hlajenje v nastavitvah s 3 do 4 grafičnimi procesorji, se izogibajte nepihalnim ventilatorjem.
Druga možnost je vodno hlajenje. Čeprav je draga, je ta metoda veliko bolj tiha in zagotavlja, da tudi najkvalitetnejše nastavitve GPU ostanejo hladne med celotnim delovanjem.
Zaključek
Za večino uporabnikov, ki se potrudijo v globoko učenje, bosta RTX 2080 Ti ali Titan RTX zagotovila največji zaslužek za vaš denar. Edina pomanjkljivost RTX 2080 Ti je omejena velikost 11 GB VRAM-a. Vadba z večjimi velikostmi serij omogoča modelom, da trenirajo hitreje in veliko natančneje ter tako prihranijo veliko časa uporabnika. To je mogoče le, če imate Quadro GPU ali TITAN RTX. Uporaba polovične natančnosti (FP16) omogoča, da se modeli prilegajo grafičnim procesorjem z nezadostno velikostjo VRAM-a [2]. Za naprednejše uporabnike pa bi morali vložiti Tesla V100. To je naša najboljša izbira za najboljšo grafično kartico za umetno inteligenco, strojno učenje in globoko učenje. To je vse za ta članek. Upamo, da vam je bilo všeč. Do naslednjič!
Reference
- Najboljši grafični procesorji za umetno inteligenco, strojno učenje in poglobljeno učenje v letu 2020
- Najboljši grafični procesor za globoko učenje v letu 2020
- NVIDIA AI INFERENCE PLATFORM: Ogromen preskok v zmogljivosti in učinkovitosti storitev AI, od podatkovnega centra do roba omrežja
- Grafični procesor NVIDIA V100 TENSOR CORE
- Merila globokega učenja Titan RTX