Apple otkrio da stari trik drastično poboljšava AI modele

Nova studija u koautorstvu Appleovih istraživača pokazuje kako metoda temeljena na popisima za provjeru, nazvana RLCF, značajno unapređuje performanse jezičnih modela, čineći ih pouzdanijima u izvršavanju složenih zadataka

Bug.hr utorak, 26. kolovoza 2025. u 19:22
📷 Foto: Unsplash
Foto: Unsplash

U novoj studiji koju su objavili i istraživači iz Applea, veliki jezični model otvorenog koda (LLM) pokazao je značajna poboljšanja performansi nakon što mu je rečeno da provjeri vlastiti rad pomoću jednostavnog, ali moćnog trika za produktivnost. Kako prenosi 9to5Mac, ključ leži u korištenju popisa za provjeru (checklist).

Nakon što se veliki jezični model istrenira, njegova se kvaliteta obično dodatno poboljšava kroz fazu poznatu kao učenje potkrepljivanjem na temelju ljudskih povratnih informacija (RLHF). U tom procesu, ljudski ocjenjivači daju "palac gore" ili "palac dolje" na odgovore modela, čime ga nagrađuju ili kažnjavaju. S vremenom, model uči koji odgovori donose pozitivne reakcije i njegova ukupna korisnost raste. Ovaj proces dio je šireg polja "usklađivanja" (alignment), čiji je cilj osigurati da se AI modeli ponašaju na koristan i siguran način.

Međutim, Appleovi istraživači u studiji naslovljenoj Checklists Are Better Than Reward Models For Aligning Language Models predlažu novu, učinkovitiju metodu: učenje potkrepljivanjem na temelju povratnih informacija s popisa za provjeru (RLCF). Umjesto jednostavnog "sviđa mi se / ne sviđa mi se" signala, RLCF ocjenjuje odgovore modela na ljestvici od 0 do 100 za svaku stavku na unaprijed definiranom popisu.

"Usporedili smo RLCF s drugim metodama usklađivanja primijenjenim na snažan model za praćenje uputa (Qwen2.5-7B-Instruct) na pet široko proučavanih mjerila – RLCF je jedina metoda koja je poboljšala performanse na svakom mjerilu, uključujući povećanje stope zadovoljstva od 4 postotna boda na FollowBench, povećanje od 6 bodova na InFoBench i rast stope pobjeda od 3 postotna boda na Arena-Hard“, objašnjavaju istraživači.

Zanimljiv je i način na koji se ti popisi kreiraju. Istraživači su, koristeći snažniji "učiteljski" AI model (Qwen2.5-72B-Instruct), automatski generirali popise za 130 tisuća različitih uputa, stvarajući tako novi skup podataka nazvan WildChecklists. Za svaku korisničku uputu, sustav generira kratki popis konkretnih da/ne zahtjeva (npr. "Je li odgovor preveden na španjolski?"). Zatim, "učiteljski" model ocjenjuje odgovore "učeničkog" modela prema svakoj stavci na popisu, a te ponderirane ocjene postaju signal za daljnje fino podešavanje.

Istraživači ističu da je njihova metoda usmjerena na "složeno praćenje uputa" i možda nije idealna za sve druge slučajeve upotrebe. Također, naglašavaju da RLCF poboljšava praćenje uputa, ali nije dizajniran za sigurnosno usklađivanje. Jedno od ograničenja je i to što se oslanja na snažniji model koji djeluje kao "sudac" za podešavanje manjeg modela.

Ipak, studija nudi jednostavan i inovativan način za poboljšanje pouzdanosti AI modela, što je ključno za budućnost AI asistenata koji će postati standardno sučelje za interakciju s našim uređajima. To postaje još važnije s obzirom na to da će asistenti sve više dobivati agentske sposobnosti, gdje će precizno praćenje uputa i usklađenost biti od presudne važnosti.

 



HI-FI SETUP TJEDNA: Denon, JBL

Novosti

Slušaonica Ronis Velesajam

U našoj slušaonici svakodnevno slažemo zanimljive hi-fi sisteme raznih razina kompleksnosti, kvalitete i cijene za prezentacije našim posjetiteljima.

2.277 EUR Kupi

Flagship prestižne serije 100.

Akcija

ACOUSTIC ENERGY AE120²

Zvučnik 3-smjerni, 130mm papirnati wooferi, 25mm kupolasti visokotonac, frekv. raspon 39Hz–26kHz, osjetljivost 90dB, max 200W, impedancija 6Ω, SPL 116dB, crossover 300Hz/2.7kHz.

956 € 1.062 € Akcija

Nagrađivani wireless speaker sustav.

Akcija

KEF LSX II

Bežični Hi-Fi zvučnici 2-smjerni s Uni-Q driverom (19mm Al dome, 115mm Mg/Al cone), raspon 49Hz–47kHz, pojačalo 70W+30W Class D, max SPL 102dB. Podrška za AirPlay2, Chromecast, Spotify, Tidal, hi-res do 384kHz/24bit. Dim. 240×155×180mm, težina seta 7,2kg.

999 € 1.399 € Akcija

Zvuk visoke rezolucije s naprednim DSP-om.

Akcija

BOWERS & WILKINS Px8

Flagship noise-cancelling bežicne naglavne slušalice, 2x 40mm karbonske pogonske jedinice, 24 bit DSP, ugradeno 6 mikrofona, aptX Adaptive Bluetooth, 30 sati reprodukcije

449 € 479 € Akcija

Kompaktna veličina. Moćan zvuk.

Akcija

ARGON AUDIO 1 DAB

DAB band: band III, L-band (ukljucujuci DAB +), Zaslon: 2 reda OLED, FM: 87,5-108 MHz, Ulaz/Izlaz: Stereo In/Out (Mini Jack), izlaz za slušalice, Funkcija mirovanja i tipka za odgodu

119 € 159 € Akcija

Prilagodite svoje slušno iskustvo.

Akcija

SENNHEISER ACCENTUM PLUS

rzo punjenje: 10 minuta ukljucivanja za 5 sati reprodukcije, Sennheiser Signature Sound, Adaptivni hibridni ANC, 50-satno vrijeme reprodukcije na bateriji, Personalizacija zvuka

148,90 € 229,90 € Akcija

Ultimativni 3D zvuk.

Akcija

SAMSUNG Music Frame HW-LS60D/EN

2 Ch, Dolby ATMOS, Q- Symphony, One Remote Control, Wireless Dolby Atmos, Spotify Connect, HDMI, Wi-Fi, Bluetooth, HDMI In 1 / Out 1 (eARC), Optical In 1, (Š x V x D): 35,30 x 36,48 x 14,34 cm

299 € 449 € Akcija

Kompatibilan s većinom subwoofera.

Akcija

AUDIOQUEST Sub IRISH RED 2m

AudioQuest Irish Red RCA kabel za subwoofer povezuje pojačala, prijemnike, soundbarove i AVR uređaje. Masivni vodiči sa 0,5% srebra smanjuju izobličenja, pjenasti polietilen čuva dinamiku, a metalni sloj uklanja visokofrekventne smetnje.

89 € 103 € Akcija

Bezvremenski uređaj.

Preporuka

NAD C 3050 pojačalo

NAD C 3050 stereo pojačalo spaja retro dizajn s modernom tehnologijom. Nudi 100W po kanalu, HybridDigital UcD pojačalo, TI visokorezolucijski DAC, HDMI eARC, MM phono ulaz, Bluetooth aptX HD i podršku za MDC2 nadogradnje s BluOS streamingom i Dirac Live korekcijom prostorije.

1.489 € Kupi

Zapanjujuća kvaliteta zvuka.

Preporuka

CAMBRIDGE AUDIO CXN 100

Cambridge CXN100 mrežni player s ESS ES9028Q2M SABRE32 DAC-om i StreamMagic Gen4 modulom donosi vrhunski zvuk, podršku za MQA, Spotify, Tidal, Qobuz, Deezer, internet radio, Roon Ready funkcije te povezivanje preko USB, Coaxial, TOSLINK, Chromecast, AirPlay 2 i Bluetootha uz veliki hi-res zaslon.

1.089,00 € Kupi

Streaming pojačalo s ugrađenim HEOS-om.

Preporuka

DENON PMA-900HNE

Stereo pojačalo 50W+50W (8Ω), 85W+85W (4Ω), THD 0.01%, MM/MC phono ulaz, Subwoofer pre-out, A/B zvučnici, OLED zaslon. Wi-Fi 2.4/5GHz, Bluetooth, AirPlay 2, Alexa, Google Assistant, Siri. Streaming: Spotify, Tidal, Deezer, Amazon Music. Podržava DSD, FLAC, WAV, ALAC. Dim. 434×376×131mm, 8.3kg.

749 € Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi