ASUS TUF Gaming RTX 3080 OC: Ampere a sosit

gaming

Iată prima rânduială din seria RTX 3000 pe care am pus-o împreună cu 2080 Ti pentru a afla ce a însemnat doi ani de dezvoltare.






Urmărirea mai bună a fasciculului

Urmărirea radiațiilor a fost omisă în mod intenționat din paginile anterioare, deoarece merită o explicație mai mare a ceea ce sa schimbat. NVIDIA desemnează unitățile responsabile pentru proces ca așa-numitele nuclee RT, iar una dintre ele este un procesor pe multiprocesor, adică pentru cipul GA102. 84. În realitate, acest lucru este mai complicat deoarece aceste nuclee RT au un controler și. Din acest motiv, considerăm că este important să descriem că, atunci când vorbim despre un nucleu RT, discutăm de fapt o parte a sarcinii de trasare a razelor, și anume examinarea intersecției și a traversării.

Dar nu este vorba doar de hardware, Microsoft face schimbări semnificative din perspectiva software-ului. Când a fost introdus primul DirectX Raytracing - îl numim DXR 1.0 deoarece părțile interesate fac deja acest lucru - a oferit așa-numitul raytracing pe bază de shader dinamic. Nu știa decât că funcționează, dar nu era deloc optimizat pentru performanță. Sistemul a făcut-o practic trăgând razele, hardware-ul a căutat unde să lovească un triunghi, de exemplu, dacă ar exista o lovitură, și o lovitură (în cazul unei lovituri) sau o lovitură (fără lovitură) ar putea veni în consecință. Oricare ar fi fost apelat de program, acesta a fost legat de tabelul de conexiune relevant și, pe baza acestuia, sistemul putea partaja datele necesare cu shader-ul hit sau miss, adică calea unui fascicul a fost urmată în acest fel.

H irde t și

Noul DirectX Raytracing, scurt pentru DXR 1.1, introduce așa-numitul raytracing inline. Aceasta este o schimbare fundamentală față de metoda anterioară, deoarece tabelul de cabluri va fi eliminat și nu vor mai exista umbrere dinamice separate. În schimb, shader-ul original conține deja structura contextuală și instruiește hardware-ul să înceapă pasul cu crawlere. Dacă o rază are o lovitură, funcția revine și structura contextuală este deja în shader, care poate începe să funcționeze imediat, nu este nevoie să mutați date sau să începeți un shader dinamic separat.






La nivel de software, aceasta este o diferență foarte semnificativă, iar trasarea în linie, de exemplu, presupune că programatorul hardware este capabil să urmeze calea fasciculului. Dacă nu, trebuie să scrieți un fel de emulare, care, deși într-o formă invizibilă pe partea laterală a programului, readuce placa de cablare chiar dacă linia de asamblare proaspătă a extras-o.

NVIDIA nu dezvăluie atât de multe despre implementarea hardware a acestui lucru. În mod clar, Turing a fost conceput pentru un raytracing bazat pe nuanțe dinamice, deoarece părea totuși că va fi direcția corectă la acel moment, abia de atunci Microsoft s-a răzgândit și a venit cu o soluție alternativă. Nu există date exacte despre cât de bine este pregătit Ampere pentru acest lucru, cu toate acestea, este probabil ca programul să fi evoluat atât de mult încât hardware-ul să fie optim pentru trasarea în linie.

În cadrul nucleelor ​​RT, componentele pentru tăiere și parcurgere a procesului de mai sus sunt cultivate. Pentru a o spune foarte simplu, acesta din urmă ajută razele trase în mod coerent de pe cameră să traverseze scena complet până la o anumită distanță și, datorită primelor, se va examina ce au lovit.


Nucleul Turing și Ampere RT [+]

În cazul Ampere, NVIDIA a făcut două modificări la nucleele RT în cauză. Printre altele, testul de intersecție pentru triunghiuri a devenit de două ori mai rapid, ceea ce este o veste bună, deoarece Turing nu a avut aici nicio combinație și există o nouă componentă care poate interpola poziția acelui triunghi în funcție de timp. Cu acesta din urmă, efectele de estompare a mișcării pot fi accelerate hardware.

Există o altă inovație, dar nu aparține îndeaproape nucleelor ​​RT. După cum s-a descris mai devreme, această unitate este responsabilă doar pentru o parte a întregului proces, dar chiar și trasarea razelor necesită procesoare generale (foarte mult), deci există părți ale sarcinilor care rulează pe blocuri de calcul de multiprocesoare. În cazul lui Turing, acestea au luat capacitatea de calcul gratuită de la grafică, dar la Ampere, grație suportului FP32 pentru matricea de procesare secundară INT32 deja detaliată pe prima pagină, nu vor face procesor implicit. Această formă competitivă de execuție poate accelera oarecum execuția unui efect de urmărire a razei. Cu toate acestea, această caracteristică nu funcționează automat, aplicațiile trebuie pregătite pentru aceasta într-un mod similar, de exemplu, se folosește calculul asincron.

Articolul nu s-a terminat încă, vă rugăm să derulați!