Brza, vruća i skupa
- autor Denis Arunović
- sri 28.4.2010
- 20:30
Prije nego što zagrizemo u srž teme, a to su specifikacije, mogućnosti i arhitektura novih GeForceova, morat ćemo vas razočarati. Iako nam je Nvidia bila najavila da ćemo karticu dobiti na testiranje, na kraju se to ipak nije dogodilo. To ujedno prilično dobro ilustrira jedan od glavnih uzročnika kašnjenja i općenite nedostupnosti kartica temeljenih na arhitekturi Fermi. Riječ je o ekstremno niskom udjelu ispravnih čipova u odnosu na broj čipova koji je teoretski moguće proizvesti.
Nvidijini se GPU-ovi, naime, proizvode na istom mjestu kao i AMD-ovi - u tajvanskoj tvornici čipova TSMC. TSMC je pri prelasku na 40-nanometarski proizvodni proces imao velikih problema, a situacija nije sjajna ni dan-danas. Nvidia je na ove probleme jednostavno bila (i još uvijek jest) mnogo osjetljivija u odnosu na AMD. Sjetimo se, prvi Radeon temeljen na 40-nanometarskom procesu predstavljen je u travnju 2009. Bilo je to model HD 4770, namijenjen igračima koji žele što bolji omjer performansi i cijene. S druge strane, Nvidijini eksperimenti s 40-nanometarskim procesom iskristalizirali su se tek krajem iste godine u obliku minijaturnog čipa GT218 koji je uglavnom udomljen na jeftinim karticama koje rabe OEM proizvođači računala.
Da stvar bude bolja, Nvidia je i ovaj put ciljala na grdosiju od čipa. Fermi, odnosno GF100, sastoji se od oko 3,2 milijarde tranzistora, što je za gotovo dvije milijarde više u odnosu na GTX 285 (GPU prethodne generacije), odnosno milijardu više u odnosu na AMD-ov Cypress (čip koji je temelj Radeona HD 5870). Kad se zbroje problemi s procesom na strani samog proizvođača čipova, Nvidijino neiskustvo te veličina čipa, kašnjenje Fermija zapravo je sasvim očekivana stvar.
Spašavanje projekta
Ipak, to nije sve. Originalni dizajn Fermija podrazumijevao je osjetno više performanse nego što danas imaju kartice GeForce GTX 480. Te više performanse temeljene su kako na višem taktu samog GPU-a, tako i na dodatnim shaderskim procesorima i pripadajućem sklopovlju. Konkretno, umjesto 480, GF100 je originalno trebao imati 512 shaderskih procesora, a pretpostavlja se da je takt skresan za minimalno 50 MHz. Razlog su tome ponovo problemi s proizvodnjom. Za pretpostaviti je da su yieldovi potpuno ispravnih GPU-ova toliko niski da ih nije bilo smisla koristiti kao temelj modela grafičkih kartica koje će se masovno proizvoditi. Punokrvni Fermi najvjerojatnije će zaživjeti u obliku ultraskupih Tesla kartica ili, eventualno, kao nekakav osvježeni proizvod kada i ako TSMC u suradnji s Nvidijom uspije dovoljno poboljšati yield čipova.
Premda je skresan, Fermi kakav nam Nvidia nudi u obliku GeForceova GTX 480 i 470 prilično je impresivan čip. Nvidijini inženjeri osobito su se fokusirali na performanse pri korištenju teselacije. Riječ je o jednoj od najbitnijih značajki DirectX-a 11 koja omogućava stvaranje dodatne geometrije na samom grafičkom čipu. Time se iz jednostavnih geometrijskih modela putem algoritama generiraju višestruko kompleksniji modeli, što ne samo da pojednostavljuje posao dizajnera igara, već i smanjuje potrebu za korištenjem drugih zahtjevnih grafičkih efekata kao što su bump mapping ili parallax occlusion mapping.
Geometrija na steroidima
Za razliku od AMD-a, koji je u Cypress ugradio jednu veliku teselacijsku jedinicu koja procesirane podatke šalje paru rasterizacijskih jedinica, Nvidia u Fermiju koristi osjetno drugačiji pristup. GF100 je podijeljen na četiri GPC-a, odnosno Graphics Processing Clustera na koje možemo gledati kao svojevrsne mini-GPU-ove. Svaki od njih ima vlastitu rasterizacijsku jedinicu, do četiri klastera streaming multiprocesora i polymorph engine dodijeljen svakom od klastera. Upravo se polymorph engineovi brinu za teselaciju, ali i za neke druge funkcije koje su prije u domeni jedinica s fiksnom funkcijom. Konkretno, riječ je o vertex fetchu, viewport transformu, attribute setupu i stream outputu. Rasterizacijski se engine pak, osim za samu rasterizaciju, brine i za edge setup te Z-cull.
Zašto su Nvidijini inženjeri odlučili odstupiti od dizajna s fiksnim funkcijama koji je korišten kako na starijim inkarnacijama GF arhitekture, tako i na novim AMD-ovim Radeonima? Zato da bi se način funkcioniranja novog GPU-a što više približio načinu funkcioniranja modernog CPU-a koji je pak temeljen na out of order izvršavanju instrukcija (o razlici između in order i out of order obrade instrukcija pročitajte u okviru uz tekst). To pogoduje izvršavanju CUDA aplikacija, no uvelike pogoduje i obradi velike količine geometrijskih podataka, što se događa pri uporabi teselacije.
Pri ovakvom pristupu obradi podataka izuzetno je bitna sinkronizacija kako bi krajnji izračun koji je rezultat procesiranja u više jedinica bio točan. Nvidia je zato polymorph jedinice povezala posebnim komunikacijskim kanalom. Sve to omogućava Fermiju da na papiru ima osmerostruko bolje performanse pri geometrijskim izračunima u odnosu na GT200b, odnosno čip na kojem je temeljen GeForce GTX 285. Za usporedbu, isti čip ima tek trostruko bolje geometrijske performanse u odnosu na prastari GeForce FX 5800.
izdvojeni tekstovi - svibanj 2010.
MSI WindTop AE2020
Ionizacija dodira pon 10.5.2010
Miroslav Rosandić
Tiha akvizicija sri 28.4.2010
NVIDIA Fermi
Brza, vruća i skupa sri 28.4.2010
Mionix Saiph 1800, Mionix Saiph 3200, Mionix Naos 5000
Specijalno za igrače sri 28.4.2010
HTC Legend
Novi Heroj sri 28.4.2010
AutoCAD 2011
3D bez naočala sri 28.4.2010
Sony Vegas Pro 9
Drugačije s videom sri 28.4.2010
Apple
Tehnologija sa stilom sri 28.4.2010
Hladnjaci s cijenom do 350 kn
Hlađenje za razumne sri 28.4.2010
Pokretanje računala
Elektronički Big Bang sri 28.4.2010
Internetski preglednici
Manjak inovativnosti sri 28.4.2010
Grooveshark
Glazbena riznica za nula kuna sri 28.4.2010
Izvršavanje iste radnje u različitim uredskim paketima
Može li i besplatno? sri 28.4.2010
Početnica za Android OS
Mobilni izazov sri 28.4.2010
Razvoj i troškovi
Recept za dobru igru sri 28.4.2010
HTC Desire
Požuda pet 23.4.2010
Sony Ericsson XPERIA X10
Najveći Android pon 12.4.2010















