Asinkroni računi, AMD, Nvidia i DX12: Ono što do sada znamo

AMD-vs-NV

Otkako je DirectX 12 najavljen, AMD i Nvidia se zezaju oko toga tko će od njih ponuditi bolja podrška za novi API i njegove razne značajke. Jedna od mogućnosti o kojoj je AMD intenzivno razgovarao je podrška za GCN asinkroni proračun. Asinkroni izračun omogućuje svim GPU-ima koji se temelje na AMD-ovoj GCN arhitekturi istodobno izvođenje grafike i izračunavanje radnih opterećenja. Prošli je tjedan zaposlenik Oxide Gamesa izvijestio da je Nvidia hardver suprotan općem uvjerenju nije mogao izvesti asinkrono računanje te da je učinak pokušaja na izvedbu katastrofalan za hardver tvrtke.

Ova je najava pokrenula mnoštvo istraživanja onoga što je Nvidia hardver radio, a što nije podržavao, kao i anegdotalne tvrdnje da će ljudi vratiti (ili su već vratili) svoje GTX 980 Ti na temelju Pepeo singularnosti izvođenje. Posljednjih nekoliko dana proveli smo u razgovoru s raznim izvorima koji rade na problemu, uključujući Mahigan i CrazyElf na Overclock.net, kao i raščlanjivanjem različitih skupova podataka i izvješća o izvedbi. Nvidia još nije odgovorila na naš zahtjev za pojašnjenjem, ali evo situacije kakvu trenutno razumijemo.



Nvidia, AMD i asinkroni proračun

Kada AMD i Nvidia govore o podršci asinkronog računanja, ne govore o istoj hardverskoj mogućnosti. Asinkroni naredbeni motori u AMD-ovim GPU-ima (između 2-8, ovisno o tome koju karticu posjedujete) sposobni su izvršavati nova radna opterećenja u latencijama nižim od jednog ciklusa. Vrhunska AMD kartica ima osam ACE-ova, a svaki ACE ima osam redova. Za razliku od toga, Maxwell ima dva cjevovoda, od kojih je jedan visokoprioritetni grafički cjevovod. Drugi ima dubinu reda od 31 - ali Nvidia ne može prebaciti kontekst ni blizu tako brzo kao što to može AMD.



NV-Preemption

Prema govoru održanom na GDC 2015, postoje ograničenja za Nvidijine mogućnosti preuzimanja. Dodatni tekst ispod slajda objašnjava da 'GPU može mijenjati kontekst samo na granicama poziva za crtanje' i 'Na budućim GPU-ovima radimo na omogućavanju preciznijeg spremanja, ali to je još daleko'. Da bi istražili različite mogućnosti Maxwella i GCN-a, korisnici Beyond3D i Overclock.net koristili su asinkrone računske testove koji su procjenjivali sposobnost i na AMD-ovom i na Nvidijinom hardveru. Mjerilo je revidirano više puta tijekom tjedna, tako da rani rezultati nisu usporedivi s podacima koje smo vidjeli u kasnijim izvođenjima.



Imajte na umu da je ovo test asinkronog izračuna latencija, a ne izvedba. Ovo ne testira ukupnu propusnost - drugim riječima, koliko je vremena potrebno za izvršavanje - i test je osmišljen kako bi pokazao javlja li se asinkrono računanje ili ne. Budući da je ovo test latencije, niži brojevi (bliže žutoj liniji '1') znače da su rezultati bliži idealnim.

Radeon R9 290

Evo izvedbe R9 290. Žuta linija je savršenstvo - to bismo dobili da se GPU trenutno prebaci i izvrši. Os y grafikona prikazuje normalizirane performanse na 1x, gdje bismo očekivali savršenu asinkronu latenciju. Crvena crta je ono što nas najviše zanima. Pokazuje kako GCN u većini slučajeva izvodi gotovo idealno, održavajući performanse stabilnim čak i kad broj niti raste. Sad ovo usporedite s Nvidijinim GTX 980 Ti.



vevF50L

Pokušaj izvođenja grafike i istodobnog izračunavanja na GTX 980 Ti uzrokuje padove i skokove u performansama i malo napretka. Trenutno postoji samo nekoliko brojeva niti u kojima se Nvidia podudara s idealnim performansama (latencija, u ovom slučaju) i u mnogim slučajevima kada se ne. Daljnja istraga pokazala je da se čini da se Nvidinin asinkroni cjevovod oslanja na CPU za neke od njegovih početnih koraka, dok AMD-ov GCN rješava posao u hardveru.

Trenutno najbolji dostupni dokazi sugeriraju da kada AMD i Nvidia govore o asinkronom računanju, govore o dvije vrlo različite mogućnosti. 'Asinkroni proračun', zapravo, nije nužno najbolje ime za ono što se ovdje događa. Pitanje je mogu li Nvidijini grafički procesori pokretati grafiku i izračunavati radna opterećenja istovremeno. AMD može, zahvaljujući svojim ACE jedinicama.

Sugerira se da je AMD-ov pristup više poput Hyper-Threadinga, koji GPU-u omogućuje istovremeno rad na različitim računalnim i grafičkim opterećenjima bez gubitka performansi, dok se Nvidia možda oslanja na CPU za neke od svojih početnih koraka postavljanja i pokušava raspored simultanih računanja + grafičko opterećenje za idealno izvršenje. Očito taj postupak još uvijek ne funkcionira dobro. Od našeg početnog članka, Oksid je ondje izjavio sljedeće:

“Zapravo smo upravo razgovarali s Nvidijom o Async Computeu, uistinu ga upravljački program još nije u potpunosti implementirao, ali izgledalo je kao da jest. Usko surađujemo s njima jer u potpunosti implementiraju Async Compute. '

Evo što to vjerojatno znači, s obzirom na vlastite Nvidijine prezentacije na GDC-u i različita mjerila za testiranje koja su sastavljena tijekom proteklog tjedna. Maxwell nema konfiguraciju asinkronih računarskih strojeva u GCN stilu i ne može se prebacivati ​​između grafike i izračunati radna opterećenja tako brzo kao GCN. Prema korisniku Beyond3D Ext3h:

“Prvobitno se tvrdilo da Nvidijini grafički procesori uopće ne bi mogli izvršavati asinkrone računalne sjenčače na asinkran način, ovaj je mit brzo razotkriven. Ono što je, međutim, postalo jasno je da su Nvidijini grafički procesori preferirali puno manje opterećenje od AMD kartica. Pri malim opterećenjima, Nvidijini grafički procesori kružili bi oko AMD kartica. Pri velikom opterećenju, pa, upravo suprotno, sve do trenutka kada je Nvidijinim grafičkim procesorima trebalo toliko vremena da obrade radno opterećenje da su pokrenuli zaštitne mjere u sustavu Windows. Zbog čega je Windows povukao okidač i ubio upravljački program, pod pretpostavkom da je zapeo.

“Konačni rezultat (za sada): AMD-ovi grafički procesori sposobni su podnijeti mnogo veće opterećenje. Otprilike 10 puta veći od Nvidijinih grafičkih procesora. Ali također im je potreban približno četverostruki pritisak koji je primijenjen prije nego što počnu igrati svoje sposobnosti. '

Ext3h nastavlja da se prevencija u Nvidijinom slučaju koristi samo prilikom prebacivanja između grafičkih konteksta (1x grafički + 31 računski način) i 'čistog proračunskog konteksta', ali tvrdi da je ta funkcionalnost 'posve slomljen”Na karticama Nvidia trenutno. On također navodi da iako je Maxwell 2 (obitelj GTX 900) sposoban za paralelno izvršavanje, „Hardver od toga nema puno koristi, jer u svakom slučaju ima samo malo„ praznina “u iskorištavanju sjenera. Dakle, na kraju je to još uvijek samo sekvencijalno izvršavanje većine radnog opterećenja, iako ako ste na neki način uspjeli zaustaviti cjevovod konstruiranjem nesretnog radnog opterećenja, još uvijek biste mogli od toga profitirati. '

U međuvremenu, Nvidia je Oxidu to rekla limenka implementirati asinkrono računanje, međutim, i da ta mogućnost nije bila u potpunosti omogućena u upravljačkim programima. Poput Oksida, pričekat ćemo i vidjeti kako će se situacija razvijati. Nit analize na Beyond3D vrlo jasno pokazuje da je ovo nevjerojatno složeno pitanje, a mnogo toga što Nvidia i Maxwell mogu ili ne moraju raditi nije jasno.

Ranije smo spomenuli da je AMD-ov pristup asinkronom računanju površno nalikovao Hyper-Threadingu. Postoji još jedan način na koji se ta analogija može pokazati točnom: kada je Hyper-Threading debitirao, mnogi AMD-ovi obožavatelji pitali su zašto Team Red nije kopirao značajku kako bi poboljšao performanse na K7 i K8. U to je vrijeme AMD-ov odgovor bio da su procesori K7 i K8 imali puno kraće cjevovode i vrlo različite arhitekture te je kao rezultat manje vjerojatno da će imati koristi od Hyper-Threadinga. Za razliku od toga, P4 je imao dugačak cjevovod i relativno visoku stopu zaustavljanja. Ako se jedna nit zaustavila, HT je dopustio da se druga nit nastavi izvršavati, što je povećalo ukupne performanse čipa.

Asinkrono računanje u stilu GCN-a vjerojatno neće poboljšati Maxwellove performanse, drugim riječima, jer Maxwell zapravo nije dizajniran za ovakve vrste opterećenja. Hoće li Nvidia moći zaobići to ograničenje (ili nešto brže implementirati), tek ćemo vidjeti.

Copyright © Sva Prava Pridržana | 2007es.com