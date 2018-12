Prije nego što krenemo moramo naglasiti da ste ovaj sadržaj u video obliku već mogli vidjeti na ovim stranicama ili pak na našem Youtube kanalu. Razlog je jednostavan - prema njemu je snimljena video-recenzija u kojoj je kolega Matej Majstorović pročitao ovaj tekst s nekim modifikacijama i spakirao ga u jedan lijep video. Samim time ako ste već pogledali video-recenziju, nema potrebe da čitate članak. Ako je pak niste pogledali, evo je na ovom linku. Ili jednostavno nastavite čitati ovaj tekst.

Oko konkretne arhitekture na kojoj će biti temeljena nova generacija Nvidijinih grafičkih kartica dosta se špekuliralo, no zapravo nitko nije očekivao da će tvrtka napraviti tako velik i nekonvencionalan iskorak. Da se podsjetimo, serija kartica GeForce GTX 1000, dakle posljednja prije ove nove, bila je temeljena na arhitekturi Pascal, a koja je, pak, predstavljala izravnu nadogradnju na arhitekturu Maxwell. Nvidia je u svojim planovima razvoja svojedobno specificirala i arhitekturu Volta, no na kraju je ispalo da se Volta koristila isključivo na profesionalnom tržištu. Nova arhitektura Turing, samim time, predstavlja evoluciju u odnosu na Voltu, a ne Pascal. Naime, već je i Volta uz standardne CUDA, imala i jezgre Tensor, namijenjene AI izračunima. Turing donosi i RT jezgre koje, pogađate, na sebe preuzimaju izračune vezane za raytracing.

Skupo i lijepo

No što je uopće taj famozni raytracing? Riječ je o načinu izračuna 3D scene, u kojem se prati putanja i lom zraka svjetlosti. Raytracing je svojevrsni Sveti gral kompjuterske grafike, jer je temeljen na istom fizikalnom modelu kojim naše oči vide stvarni svijet. I premda se ta metoda rabi za renderiranje u hollywoodskim studijima za visokobudžetne filmove, računski je brutalno zahtjevnan i dosad nije bila iskoristiva u kontekstu računalnih igara. Dok je 3D animacije i scene za film moguće renderirati doslovno satima i danima, oči nas, igrača, očekuju renderiranje grafike u stvarnom vremenu, pri barem 60 sličica po sekundi, a idealno i puno više.

Sukladno hardverskim ograničenjima, aktualna 3D grafika u igrama temeljena je na metodi koja se zove rasterizacija, a koja je zamišljena kao brza, no ne previše točna aproksimacija igre svjetla, sjene, boja i objekata na ekranu. Nvidia uz pomoć RT jezgri, dakle dediciranog hardvera, planira u tu rasterizaciju ubaciti atraktivne efekte, odrađene raytracingom. Drugim riječima, raytracing kompletne scene i dalje je daleko prezahtjevan za današnju tehnologiju, no Nvidia se osjetila spremnom zagrebati površinu i krenuti od postupnog dodavanja podrške.

Lista igara koje će dobiti podršku za raytracing efekte nije velika, no na njoj su i neka velika imena – Battlefield V (koji je Nvidia iskoristila za prezentaciju raytracinga), Mechwarrior 5: Mercenaries, Shadow of the Tomb Raider, Assetto Corsa Competizione. Ipak, treba naglasiti da niti jedan naslov nije bio dostupan za testiranje u trenutku pisanja ovih redaka, iako su kartice lansirane u drugoj polovici listopada (mi ih nismo dobili jer Nvidia ne šljivi Hrvatsku pola posto). Štoviše, čak i da smo imali igru, ne bismo je mogli pokrenuti jer DXR, komponenta DirectX-a koja omogućuje raytracing, do posljednje nadogradnje Windowsa 10 nije bio dostupan. Da stvar bude gora, postoje dobre indicije da je Battlefield V, demo koji je služio za demonstraciju tehnologije, radio pri skromnoj Full HD razlučivosti, pri kojoj najmoćnija RTX kartica nije mogla isporučiti više od 60-ak fps. Dobra vijest je što raytracing efekti neće biti binarni – na kompatibilnim karticama moći ćemo odabrati njihovu razinu, i time prilagoditi opterećenje. U trenutku kada je napisan ovaj tekst nažalost nismo imali na raspolaganju novi Battlefield, pa ćete iscrpan test performansi i RTX efekata iz našeg laba morati malo pričekati.

Broj CUDA jezgri marginalno je povišen u odnosu na starije kartice, a dodatne tranzistori iskorišteni su za RT i Tensor jezgre

No što je s jezgrama Tensor preuzetima s Volte? Jezgre Tensor koriste se za akceleraciju izračuna prilikom strojnog učenja. Točnije, jezgre Tensor barataju 4 × 4 matricama, načinjenim od decimalnih brojeva, a na njima izvode FMA izračune – umnošku dviju matrica pribraja se treća. Iako se ista operacija može izvoditi jezgrama CUDA, jezgre Tensor izvode je mnogo puno brže. Zbog te brzine jezgre Tensor koriste se, kako na Volti, tako i na Turingu, za deep learning, što je jedna od metoda strojnog učenja temeljena na analizi setova podataka. Ti podaci mogu biti slike, tekst ili, pak, zvuk.

Struktura Turingovog Streaming Multiprocessora radikalno je drugačija od SM-ova u arhitekturi Pascal

Na novim karticama GeForce jezgre Tensor za sada bi se trebale koristiti za dvije namjene – AI korekciju rezultata raytracinga te novu tehnologiju zaglađivanja slike pod imenom DLSS, što je skraćenica od Deep Learning Super Sampling. DLSS trebao bi biti osjetno brža (25 do 40 posto) zamjena za aktualni TXAA – tehniku “peglanja”, slike koja kombinira klasični MSAA, temporalne filtre i postprocesiranje preko shadera, odnosno jezgri CUDA. Ideja je da se uz pomoć jezgri Tensor neuronska mreža “nauči” pretpostaviti kako će slika izgledati uvećana. Igra se potom renderira u nižoj razlučivosti, a uvećanje, odnosno supersampling, ne izvodi se klasično, već preko neuronske mreže pogonjene novim jezgrama Tensor. DLSS će podržavati više igara nego raytracing efekte, uključujući sve one koje smo spomenuli u kontekstu raytracinga.

Real Time Raytracing DLSS Turing Advanced Shading Ark: Survival Evolved Da Assetto Corsa Competizione Da Atomic Heart Da Da Battlefield V Da Control Da Dauntless Da Darksiders III Da Deliver Us The Moon: Fortuna Da Enlisted Da Fear The Wolves Da Final Fantasy XV Da Fractured Lands Da Hellblade: Senua's Sacrifice Da Hitman 2 Da In Death Da Islands of Nyne Da Justice Da Da JX3 Da Da KINETIK Da MechWarrior 5: Mercenaries Da Da Metro Exodus Da Outpost Zero Da Overkill's The Walking Dead Da PlayerUnknown Battlegrounds Da ProjectDH Da Remnant: From the Ashes Da SCUM Da Serious Sam 4: Planet Badass Da Shadow of the Tomb Raider Da Stormdivers Da The Forge Arena Da We Happy Few Da Wolfenstein II Da Fractured Lands Da Hellblade: Senua's Sacrifice Da Hitman 2 Da In Death Da Islands of Nyne Da Justice Da Da JX3 Da Da KINETIK Da MechWarrior 5: Mercenaries Da Da Metro Exodus Da Outpost Zero Da Overkill's The Walking Dead Da PlayerUnknown Battlegrounds Da ProjectDH Da Remnant: From the Ashes Da SCUM Da Serious Sam 4: Planet Badass Da Shadow of the Tomb Raider Da Stormdivers Da The Forge Arena Da We Happy Few Da Wolfenstein II Da

Treći novi dodatak Nvidijinom arsenalu, nove su tehnike renderiranja – korištenje Mesh shadera, Variable Rate Shading i Texture Space Shading. Pod “kišobran” Variable Rate Shadinga zapravo spada nekoliko tehnika – Content Adaptive Shading, Motion Adaptive Shading, Foveated Rendering i Lens Optimized Rendering. Potonje dvije tehnike odnose se na VR, a ciljaju optimizirati i smanjiti količinu izračuna. Content Adaptive Shading temelji se na prilagođavanju kvalitete renderiranja sljedećeg framea na bazi analize već prikazanog. Kartica analizira gdje može škrtariti kvalitetom renderiranja, a gdje ju je potrebno pojačati radi boljeg dojma. Motion Adaptive Shading, pak, prilagođava renderiranje prikazu kretanja. Objekti koji se brzo kreću ionako nam se čine mutni, pa ih nema smisla superdetaljno renderirati, a što, pak, štedi resurse za renderiranje drugih, bitnih dijelova slike. Content Adaptive Shading očekuje se u Wolfensteinu II i igri In Death.

Trošak implementacije

E sad, kao što vjerojatno znate, ubacivanje novih jedinica u bilo koji čip, znači da on mora rasti. Za proizvodnju novih GPU-ova Nvidia je na raspolaganju imala 12-nanometarski TSMC-ov proces, a koji, pak, ne nudi neko super skaliranje prema dolje, u odnosu na 16-nanometarski proces, koji se koristio na Pascal karticama lansiranim prije dvije godine. Rezultat su, pak, monstruozno veliki čipovi s monstruoznim brojem tranzistora.

Nvidia je odlučila arhitekturu Turing izbaciti na tržište u obliku tri kartice tri različita GPU-a – TU102, TU104 i TU106. Kartice na kojima se nalaze u dućanima nalaze se pod imenom GeForce RTX 2080 Ti, RTX 2080 i RTX 2070. Osim što valjda prvi put odmah imamo i Ti varijantu najjačeg modela (ranije je stizala kasnije), također prvi put imamo xx80 i xx70 varijantu kartica temeljenih na različitim verzijama GPU-a. Kod Pascala su GTX-ica 1080 i 1070 bile temeljene na jednakom čipu GP104, s time da je na slabijem modelu on bio oslabljen.

specifikacije - turing vs. pascal Kodno ime TU102 TU104 TU106 GP102 CUDA jezgre 4.608 3.072 2.304 3.840 Broj SM-ova 72 48 36 30 Jedinice za teksturiranje 288 192 144 240 RT jezgre 72 48 36 - Tensor jezgre 576 384 288 - ROP-ovi 96 64 64 96 Memorijsko sučelje 384-bit 256-bit 256-bit 384-bit L2 cache 6 MB 4 MB 4 MB 3 MB Register datoteka 18 MB 12 MB 9 MB 7,5 MB Arhitektura Turing Turing Turing Pascal Proizvodni proces TSMC 12nm "FFN" TSMC 12nm "FFN" TSMC 12nm "FFN" TSMC 16nm Površina čipa 754 mm² 545 mm² 445 mm² 471 mm²

Koliko je Turing skuplji za proizvodnju, lijepo ilustrira usporedba između novog TU102 i starog GP102 GPU-a. Novi, usprkos boljem proizvodnom procesu, ima površinu od 754 mm2, što je rast od čak 60%. Ta veća površina omogućila je blago povećanje broja jezgri CUDA (s 3.840 na 4.608) i pripadajućih jedinica za teksturiranje, ali i značajno povećanje cachea i glavnog registra te dodavanje jezgre 72 RT i jezgri 576 Tensor. Memorijski kontroler ostao je jednak, 384-bitni, baš kao i kapacitet memorije. Promijenjen je, s druge strane, tip memorije – GDDR5X zamijenio je nešto brži i moderniji GDDR6.

Memorijski sustav na Turingu ima 50% više performanse u odnosu na Pascalov, a za to su zaslužni GDDR6 i bolja kompresija podataka

Propusnost memorije, pak, osjetno je porasla u odnosu na stare kartice, jer je, uz povećanje brzine na račun memorije GDDR6, došla i novija vrsta kompresije. S obzirom na golemi skok u broju internih jedinica koje koriste memoriju, ostaje vidjeti da će performanse u primjeni jezgri RT i Tensor, paralelno s jezgrama CUDA, biti dovoljne.

TU104 GPU, koji pogoni GeForce RTX 2080, ima površinu od 545 mm2, što je više od površine GP102 iz GTX-ice 1080 Ti. Broj jezgri CUDA povećan je u odnosu na GTX 1080, s 2.560 na 2.944, a dodano je i 48 jezgri RT te 384 jezgri Tensor. Memorijski kontroler je 256-bitni kao i ranije, no napravljen je prelazak s GDDR5X na GDDR6.

Dosta je bitno napomenuti da se kod obje nove kartice dogodio skok potrošnje u odnosu na starije modele, što nije čudno s obzirom na korištenje golemih čipova, odnosno rast broja tranzistora. Još jedan skok doživjele su cijene. Tako je za RTX 2080 Ti u SAD-u potrebno izdvojiti više od 1.200 dolara, što je skoro dvostruko više u odnosu na cijenu od oko 700 do 800 dolara, koliko košta GTX 1080 Ti. Ista je priča sa slabijim modelima. RTX 2080 ima cijenu od 800 do 850 dolara, dakle, više od GTX-a 1080 Ti, a posebno osjetno više od modela koji nazivno zamjenjuje na tržištu.

Dva su razloga za ovako visoke cijene. Prvi – nove kartice doista su skuplje. I drugi – u ovom visokom segmentu nema konkurencije iz AMD-a, pa Nvidia radi što želi.

Zlatni primjerci

Gainward RTX 2080 Ti Phoenix GS Broj CUDA jezgri 4.608 RT / Tensor jezgre 72 / 576 Takt GPU-a 1.650+ MHz Memorijsko sučelje 384 bit Memorija 11 GB GDDR6, 14 Gbps Napajanje 2 × 8pin PCIe Videoizlazi 1 × HDMI 2.0b

3 × Display Port 1.4a

1 × USB-C 3.1 Gen2

Gainward RTX 2080 Phoenix GS Broj CUDA jezgri 3.072 RT / Tensor jezgre 48 / 384 Takt GPU-a 1.815+ MHz Memorijsko sučelje 256 bit Memorija 8 GB GDDR6, 14 Gbps Napajanje 1 × 8pin PCIe, 1 × 6pin PCIe Videoizlazi 1 × HDMI 2.0b

3 × Display Port 1.4a

1 × USB-C 3.1 Gen2

Kako to obično biva, s našim testom novih kartica GeForce ponovno kasnimo jer Nvidia hrvatsko tržište ne šljivi ni pola posto, pa smo morali pričekati da kartice stignu do lokalnih dućana kako bismo ih mogli posuditi i isprobati. Samim time, nemamo na raspolaganju Nvidijine modele Founder’s Edition, već Gainwardove modele iz serije Phoenix, i to podvarijantu Golden Sample.

Riječ je o karticama koje su, prema svemu sudeći, temeljene na standardnim PCB-ovima, jer su manjih dimenzija od, primjerice, PCB-a naše MSI-jeve GTX-ice 1080 Ti GamingX. Također, imaju jednak raspored videokonektora kao Nvidijine referentne kartice – tri DisplayPorta 1.4a, jedan HDMI 2.0 te jedan USB-C 3.1 Gen2, koji je namijenjen spajanju VR headsetova. USB-C 3.1 Gen2 kroz jedan konektor može provući različite signale, pa je ideja da preko jednog kabela na headset spojimo i USB, i napajanje, i DisplayPort videolink. Novost u kontekstu starijih kartica je i podrška za DisplayPort 1.4a – najnoviju verziju sučelja koja može potjerati monitore i pri razlučivosti 8K.

Kartice s druge strane imaju posebne, moćnije hladnjake u odnosu na referentne Nvidijine inačice. Hladnjaci su naizgled posve identični, s debelim bakrenim toplovodnim cijevima, masivnim aluminijskim radijatorima i kompletom od tri ventilatora, no onaj na modelu RTX 2080 Ti je deblji, pa samim time ta kartica u računalu zauzima prostor tri PCIe utora, a običan RTX 2080 samo dva. Hladnjaci su u praksi vrlo tihi, pa čak i kada su kartice maksimalno overklokirane, a temperatura GPU-a pod opterećenjem ne diže se iznad 75 °C, što je dosta impresivno. Za pretpostaviti je da velika površina GPU-ova pomaže pri prijenosu topline na hladnjak. S druge strane, nije nam jasno zašto nema pasivnog načina rada kada kartica miruje. Oko srednjeg ventilatora smješteni su i prozorčići, osvijetljeni RGB LED-icama. Boju LED-ica, pa i jesu li uopće uključene, možemo kontrolirati preko Gainwardovog alata Expert Tool II.

Drugačije je i napajanje – jača kartica traži par 8-pinskih PCIe konektora, a slabija 6-pinski i 8-pinski. Na stražnjoj strani obje kartice su debele aluminijske ploče s logom Phoenix i zlatnom značkicom GS, odnosno Golden Sample. To znači da je karticama tvornički pojačan radni takt. Boost je na jačem modelu definiran do razine od 1.650 MHz (1.545 je standardno), a na slabijem do 1.815 MHz (1.710 je standardno). Takt memorije jednak je referentnim modelima.

Overklokiranje i performanse

Valja napomenuti kako naznačeni Boost taktovi zapravo nisu maksimalni koje kartica isporučuje u praksi. Bez prčkanja po taktovima RTX 2080 Ti, u 3DMarkovom testu TimeSpy Extreme DX12 išla je do 1.935 MHz, uz prosjek od nekakvih 1.830 MHz. Ručnim overklokiranjem izvukli smo dodatnih 135 MHz za GPU i 250 MHz za memoriju (s 1,75 na 2 GHz), dok smo na jeftinijem modelu postigli jednak takt memorije, no zato nešto manji dobitak na taktu GPU-a (+100 MHz). Ipak, tu treba imati na umu da RTX 2080 u startu ima viši radni takt od skuplje kartice.

Gainward ima vlastiti alat za podešavanje takta svojih kartica. Expert Toolom mogu se prilagoditi i RGB ledice na hladnjaku

Nvidia s novom serijom kartica nudi i automatsko overklokiranje za korisnike koji to žele. Kako biste ga isprobali, potrebno je iskoristiti podržanu verziju alata kao što su MSI Afterburner ili EVGA Precision. Mi smo koristili Afterburner zato što ga obično koristimo, a u njemu je unutar sučelja zakopana ikonica za automatsko otkrivanje takta. Taj proces potrajat će 15-20 minuta, a nakon toga ćete imati krivulju takta optimiziranu baš za vašu karticu. Iako je to solidno rješenje za korisnike koji ne znaju ili ne žele ručno overklokirati, rezultati su lošiji u odnosu na ručne postavke za nekoliko desetaka megaherca, a također treba imati na umu da taj proces ne overklokira memoriju.

Gainward RTX 2080 Ti Gainward RTX 2080 MSI GTX 1080 Ti GamingX Aorus GTX 1080 Xtreme Gaming Radeon RX Vega 64 FarCry 5 1440p 132 112 111 88 91 4K 77 61 60 47 51 BF1, Ultra DX11 1440p 172 135 136 106 106 4K 100 77 78 57 61 Wolfenstein II, Mein Leben 1440p 273 214 194 144 148 4K 170 126 110 85 84 Total War: Warhammer, DX11, Ultra 1440p 100 80 79 69 74 4K 77 57 57 39 39 Rise of the Tomb Raider, DX11 Very High, SMAA 1440p 92 83 88 73 56 4K 69 53 55 40 34 Witcher 3, Ultra, Hairworks off, 4xAA 1440p 134 108 98 75 71 4K 82 64 56 44 41 Strange Brigade, DX12 Ultra 1440p 159 123 118 86 93 4K 91 68 67 49 55 Potrošnja 3DMark TimeSpy 4K 336 W 303 W 281 W 223 W 348 W

Potrošnja novih kartica u praksi viša je u odnosu na stare, što pogotovo vrijedi za odnos RTX-a 2080 i GTX-a 2080. Jači GeForce RTX istovremeno još uvijek nije toliko gladan struje kao obična Radeon RX Vega 64, AMD-ova kartica koja nudi performanse na razini GTX-a 1080. No što je s performansama novih kartica u odnosu na stare? GeForce RTX 2080 Ti doista donosi brutalne performanse u postojećim naslovima, i prava je kartica ako se po svaku cijenu želite što bolje igrati pri 4K razlučivosti. Kad kažemo po svaku cijenu, to i mislimo – rast performansi od 25 do 30% u odnosu na GTX 1080 Ti, platit ćete gotovo dvostruko više, što je pomalo suludo.

No u mnogo lošijoj poziciji nalazi se RTX 2080 – košta jednako, pa i nešto više u odnosu na GTX 1080 Ti, a nudi malen rast performansi. Naravno, za igrače koji su danas odlučili nabaviti karticu koja košta oko 7.000 kuna, a imaju GTX-icu 1080 ili slabiju, kupnja RTX-a 2080 ima smisla, no objektivno je riječ o kartici koja nije ispunila očekivanja u pogledu performansi, s obzirom na cijenu.

Iako smo sigurni da će se RTX-ice prodavati kao vruće kifle (uostalom, Nvidia nikad nije imala problema s potražnjom za svoje ultraskupe kartice Titan, koje u odnosu na RTX 2080 Ti izgledaju i jeftino), činjenica je da ne nude očekivan rast performansi u postojećim naslovima. Tranzistorski budžet iskorišten je za implementaciju AI i raytracing logike, a hoće li se to pokazati kao pogodak, ostaje vidjeti. Svakako treba naglasiti da kartice srednje klase, dakle, ekvivalent aktualnog GTX-a 1060, neće imati RT jezgre. Samim time, raytracing efekti zasad će ostati rezervirani isključivo za igrače dubokog džepa.

Gainward RTX 2080 Ti Phoenix GS Brutalne performanse

Moćan i tih sustav hlađenja

Odlična ponuda video konektora

Nativna podrška za HDR

Podrška za raytracing

DLSS

Solidan overkloker

Podrška za SLI Iznimno visoka cijena

Neodumice oko performansi u raytracing naslovima

Hladnjak nema pasivni način rada Performanse 10 Potrošnja 6 Hlađenje 9 Buka hladnjaka 9 UKUPNO 9