Premium sadržaj

Benchmarci - Mjerenje sposobnosti i performansi

Benchmarci su sasvim uobičajen i vrlo standardiziran način da se evaluiraju i provjere sposobnosti velikih jezičnih modela definiranim mjerilima, a tijekom vremena nastao je zavidan broj testova koji provjeravaju različite aspekte modela, dok svaki ima jedinstvenu svrhu i metodu procjene. Tako su tu oni koji provjeravaju opća znanja, zatim oni koji evaluiraju dijalog i sposobnost interakcije, programerski benchmarci, matematički i jezični benchmarci, oni koji provjeravaju razumijevanje uputa i slično.

Matija Gračanin subota, 29. ožujka 2025. u 06:00

RankedAI - nezavisna je web stranica koja prikazuje prilično ažurne benchmarke brojnih i trenutačno aktualnih velikih jezičnih modela. Svaki model dodaje se u roku od nekoliko sati nakon objave, a prikazuje se više od 20 mjerila performansi

Među najznačajnijim benchmarcima valja istaknuti MMLU (Massive Multitask Language Understanding), koji se smatra jednim od najboljih indikatora opće inteligencije modela kroz 57 različitih područja, od osnovnoškolske matematike preko prava pa sve do medicine. Za evaluaciju matematičkih sposobnosti najčešće se koristi MATH koji sadrži probleme s matematičkih natjecanja različitih razina složenosti, dok se za provjeru sposobnosti programiranja nerijetko koriste LiveCodeBench i Codeforces. Doduše, na umu valja imati da, premda su benchmarci korisni za standardizirano mjerenje i usporedbu jezičnih modela, rezultati ne moraju nužno pokazivati koliko će neki model doista biti upotrebljiv u stvarnosti. Osim toga, neke važne aspekte modela poput sigurnosti, pristranosti ili kontekstualnog razumijevanja, teško je provjeriti i evaluirati kroz standardizirane benchmarke. Evo i koji su trenutačno aktualni benchmarci koji su korišteni i prilikom evaluacije modela DeepSeek-R1, kako bi se mogle bolje razumjeti sposobnosti tog, kao i drugih velikih jezičnih modela…

Članak dostupan pretplatnicima

Kako bi mogao pročitati cijeli članak, moraš biti prijavljen na Bug.hr sa svojim podacima te imati status pretplatnika.

Registriraj se Prijavi se

Bug 389 travanj 2025.

Globalni ratovi GenAI modela

Prethodna tema Sljedeća tema

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Gaming G915

Uhvati uštedu

179,99€ ~~229,99€~~ Kupi

📢 Uštedi

Miš LOGITECH Gaming G402

Akcija -43%

39,99 € ~~69,99 €~~ Kupi

📢 Uštedi

E-Book Reader KOBO

Vrući popust

169,99 € ~~199,99 €~~ Kupi

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Idealne za glazbu i razgovore.

Akcija

SENNHEISER HD 620S

Dinamičke, over-ear, 6–30.000 Hz, 150 Ω, 110 dB, THD <0,05%, kabel 1,8 m, jastučići od umjetne kože.

238,90€ ~~349,90 €~~ Akcija

Iznimno dubok bas.

Akcija

SENNHEISER AMBEO

Class D pojačalo, 350W RMS, 8" woofer, frekvencijski odziv 27Hz–80Hz, Bluetooth 5.2, mono RCA ulaz, dimenzije 27,4 × 36,9 × 27,4 cm, masa 8,2 kg.

478,90 € ~~699,00 €~~ Akcija

Izuzetna jasnoća i detaljnost zvuka te dubok bas.

Akcija

BOWERS & WILKINS Px7 S3

40 mm biocelulozni driveri, DSP s integriranim DAC-om i pojačalom, Bluetooth 5.3 s aptX Lossless, Adaptive, HD i AAC kodecima, 8 mikrofona, ANC, 30 h trajanja baterije, USB-C punjenje, 7 h reprodukcije uz 15 min punjenja.

379,00 € ~~429,00 €~~ Akcija

Kompaktni high-end bookshelf zvučnici.

Akcija

REVEL M105 Performa 3

Dvostazni bookshelf zvučnici, frekvencijski raspon 56Hz–20kHz, osjetljivost 86dB, impedancija 8Ω, pojačalo 50–120W, 1" aluminijski tweeter, 5.25" aluminijski woofer, stražnji bass-reflex, crossover 2.3kHz, dimenzije 35.6 x 20 x 24.8 cm, masa 7 kg.

899,00 € ~~1.499,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II