Kaže autor, što je rezultiralo modelom od 2 milijarde parametara temeljenom na skupu podataka za treniranje od 4 trilijuna tokena. 4 trilijuna na hrvatskom iznosi 4x1018
Kaže autor, što je rezultiralo modelom od 2 milijarde parametara temeljenom na skupu podataka za treniranje od 4 trilijuna tokena. 4 trilijuna na hrvatskom iznosi 4x1018
Jedna od najboljih "značajki" 1 bit LLmova je eliminacija potrebe za GPUom.
Bit će interesantno, obzirom na poznatu "Nvidia is no longer a graphics company'" izjavu.
Možda se povijest ponovi i cjene grafulja se konačno spuste na zemlju (kao što je bilo kod crypta, iz gpuova u risc/asic tako sad kod AIa; iz gpu => arm)
Želite li odabranu poruku proglasiti točnim, funkcionalnim i najboljim rješenjem vašeg problema?
Da, prihvaćam rješenje Odustani
Adresa na koju želite proslijediti poruku**:
Komentar uz poruku:
Pošalji Odustani
*primatelj će vidjeti vašu e-mail adresu
**ukoliko želite poslati na više adresa, odvojite ih točka-zarezom
Ovdje nije moguće korištenje formatiranja teksta niti HTML tagova.
Potpis će, ukoliko ga imate, automatski biti dodan.
Pošalji Odustani
*da biste vidjeli svoju poruku na popisu, morat ćete ručno osvježiti stranicu (F5)