BitNet b1.58 2B4T
Budućnost velikih jezičnih modela je u jednom bitu (zapravo dva, ali tko broji…)?
Umjesto 16- i 32-bitnih vaganih vrijednosti koje stoje iza ogromnih statističkih repozitorija današnjih velikih jezičnih modela, budućnost je (možda) u samo tri vagane vrijednosti koje se usprkos jednobitnom imenu, mogu svesti na dvobitnu reprezentaciju -1, 0 i 1