NVIDIA DLSS s Asus ROG Strix Gaming RTX 3070 OC Edition

Tehnologija DLSS pojavila se u igrama u isto vrijeme kad i podrška za ray tracing. Dok ray tracing poboljšava izgled igre nauštrb performansi, zadatak DLSS-a je da uz pomoć strojnog učenja kompenzira te gubitke

Bug.hr petak, 28. svibnja 2021. u 16:10

Kao što smo objasnili na kraju članka o implementaciji ray tracinga, Deep Learning Super Sampling tehnologija je koju je NVIDIA razvila kao komplementarnu ray tracingu. Kako ray tracing ima golem negativni utjecaj na performanse, ideja je da se DLSS-om taj gubitak performansi svede na prihvatljivu mjeru.

DLSS se oslanja na drugu specijaliziranu vrstu računalnih jedinica u Nvidijinim GeForce RTX GPU-ovima – tenzorske jezgre (en. Tensor Core).  Ove specijalne jezgre pojavile su se prvi puta u GPU-ovima pogonjenim arhitekturom Volta, koji su bili namijenjeni profesionalnom i znanstvenom tržištu. Njihova specijalnost je iznimno brzo računanje FMADD operacija u kojoj su operandi matrice oblika 4×4. FMADD je skraćenica od Fused Multiply Add, računske operacije gdje se dva operanda množe i rezultat zbraja s trećim. Štos je u tome da se upravo ovakve matematičke operacije s matricama mnogo koriste u strojnom učenju i inferenciranju, ali i u nekim drugim računski vrlo intenzivnim poljima kao što su mehanika fluida, elektromagnetizam i astrofizika.

Nvidia je s arhitekturom Turing koja pogoni seriju GeForce RTX 20 tenzorske jezgre ubacila u kartice namijenjene običnim korisnicima. Veliko dodatno pojačanje računskih mogućnosti ostvareno je u aktualnoj arhitekturi Ampere koja nudi do 2,7 puta više performanse pri korištenju tenzorskih jezgri u odnosu na Turing. Zanimljivo je da je broj tenzorskih jezgri smanjen u odnosu na stariju arhitekturu. Pa tako GPU koji pogoni našu testnu karticu, Asus ROG Strix Gaming RTX 3070 OC Edition, ima 184 tenzorske jezgre dok ih je RTX 2070 imao 288. Ubrzanje koje Nvidia spominje događa se zbog implementacije tehnologije Sparse Deep Learning koja omogućava kompresiju matrica izbacivanjem redundantnih vrijednosti, a s manjim matricama lakše se računa.

Te nove jedinice NVIDIA je u GeForce RTX seriji kartica iskoristila za izvođenje DLSS-a – tehnologije koja se oslanja na korištenje neuronske mreže i strojnog učenja kako bi iz renderiranih frameova niže razlučivosti korisniku prikazala frameove više razlučivosti. Drugim riječima, DLSS omogućava interno renderiranje igre u nižoj razlučivosti, no konačno prikazivanje višoj razlučivosti, što rezultira osjetno višim performansama.

Prva iteracija DLSS-a nije se baš proslavila zbog slabe kvalitete prikaza konačnog rezultata. Vjerojatno najpoznatija igra s podrškom za tu prvu generaciju DLSS-a je Battlefield V, ujedno i naslov s kojim je NVIDIA naveliko promovirala ray tracing. Dodatnu komplikaciju predstavljala je činjenica da se neuronska mreža (u osnovi Nvidijino super računalo) morala trenirati za svaku pojedinu igru. Rezultati treniranja bi potom bili ugrađeni u Nvidijine drivere.

Početkom prošle godine NVIDIA izbacuje DLSS 2.0 – značajno unaprijeđenu verziju ove tehnologije. DLSS 2.0 više ne traži treniranje neuronske mreže za svaku pojedinu igru već je model dovoljno robustan da isporučuje odlične rezultate nezavisno o naslovu. Također je značajno povećana kvaliteta prikaza, a korisnicima je omogućeno i da biraju između različitih konfiguracija neuronske mreže koja preko tenzorskih jezgri odrađuje renderiranje. Ta tri moda rada su Quality, Balanced i Performance, a kontroliraju koliko se nisko interna razlučivost renderiranja spušta u odnosu na ciljanu konačnu razlučivost. Primjerice, mod Performance, kod kojeg je najviši fokus na performansama, za prikaz na razlučivosti 4K koristit će interno renderiranje na četiri puta nižoj razlučivosti – Full HD. Treba napomenuti da se DLSS može koristiti nezavisno od ray tracinga, čime je moguće postići još više performanse. 

S lansiranjem serije GeForce RTX 30 NVIDIA još jednom nadograđuje ovu tehnologiju i to na verziju 2.1. Ona donosi novi mod renderiranja Ultra Performance koji omogućava dodatno povećanje performansi. Motivacija iza implementacije tog novog profila je igranje pri razlučivosti 8K (7.680×4.320 točaka), pri čemu kartice interno renderiraju na razlučivosti 2.560×1.400 točaka.

Pogledajmo sada kako DLSS 2.0 izgleda u Cyberpunku 2077 i starijem Controlu.