Napredniji AI modeli češće haluciniraju

Što je model napredniji, veća je vjerojatnost da će generirati netočne informacije, barem u sadašnjoj generaciji tehnologije, zaključak je internog testa kompanije OpenAI

Mladen Smrekar utorak, 24. lipnja 2025. u 11:24

Iako su novi modeli poboljšali sposobnost praćenja uputa i davanja korisnih, provjerljivih odgovora, nagli porast halucinacija veliki je izazov za pouzdanost i sigurnost sustava Perplexity Pro

Najnoviji AI modeli OpenAI o3 i o4-mini postali su još snažniji i sposobniji, ali istovremeno i skloniji "halucinacijama", odnosno generiranju netočnih ili izmišljenih informacija. Ovaj fenomen detaljno je analiziran u službenom dokumentu "OpenAI o3 and o4-mini System Card".

Iako o3 pruža točnije informacije od svog prethodnika, čini se da to čini uz više halucinacija 📷 OpenAI — Iako o3 pruža točnije informacije od svog prethodnika, čini se da to čini uz više halucinacija OpenAI

Prema internim testovima, model o3 halucinira u 33 % slučajeva, dok o4-mini to čini u čak 48 % slučajeva, prema tvrtkinoj PersonQA evaluaciji koja mjeri pojavu halucinacija na temelju javno dostupnih činjenica. To je znatno više od prethodnika o1, koji je imao stopu halucinacija od 16 %. Paradoksalno, o3 istovremeno daje i više točnih odgovora, ali i više pogrešaka. To upućuje na to da je model skloniji tvrdnjama, bilo točnim ili netočnim, što pak pojačava rizik od širenja lažnih informacija.

Veliki izazov

OpenAI ističe da ovi modeli koriste najsuvremenije metode zaključivanja i mogu koristiti razne alate poput pretraživanja weba, analize slika, pokretanja Python koda i drugih automatizacija, što im omogućuje rješavanje složenih zadataka iz matematike, programiranja i znanosti. Iako su poboljšali sposobnost praćenja uputa i davanja korisnih, provjerljivih odgovora, nagli porast halucinacija je veliki izazov za pouzdanost i sigurnost sustava.

Slonost halucinacijama detaljno je analizirana u službenom dokumentu 'OpenAI o3 and o4-mini System Card' 📷 OpenAI — Slonost halucinacijama detaljno je analizirana u službenom dokumentu 'OpenAI o3 and o4-mini System Card' OpenAI

OpenAI ističe potrebu za daljnjim istraživanjem uzroka ovog fenomena i smanjivanjem rizika, ali trenutačno je osnovni zaključak: što je model napredniji, veća je vjerojatnost da će generirati netočne informacije, barem u sadašnjoj generaciji tehnologije.

Vezano

📢 Provjeri

Monitor 23.8" XIAOMI Mi 1C

Sniženo 20%

79,99€ ~~99,99€~~ Kupi

📢 Otkrij

Laptop LENOVO IdeaPad 1

Uhvati priliku

479,99€ ~~599,99€~~ Kupi

📢 Uštedi

Pametni sat HUAWEI Watch Fit 3

Provjeri odmah

139,99€ ~~169,99€~~ Kupi

📢Provjeri

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Originalne BBC komponente i autentični topli zvuk.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC monitor, Falcon B110 niskotonac, Falcon T27 visokotonac, ručno rađeni skretnica FL6/23, frekvencijski odziv 70 Hz – 20 kHz, impedancija 15 Ω, osjetljivost 82.5 dB, snaga 50–80 W, kabinet Baltik ply, BBC Tygan mrežica, Golden Madrone furnir.

3.439 € ~~4.299 €~~ Akcija

Vrhunsko integrirano pojačalo s Hypex nCore tehnologijom.

Akcija

Pojačalo NAD C 399

Snaga 180 W (8/4 Ω), dinamička snaga do 506 W (2 Ω), THD <0.02%, S/N omjer >95 dB, frekvencijski odziv ±0.3 dB (20 Hz–20 kHz), razdvajanje kanala >90 dB, ulazna osjetljivost 201 mV, Bluetooth podrška do 24-bit / 192 kHz.

1.869 € ~~2.199 €~~ Akcija

Čist i precizan zvuk.

Akcija

ACOUSTIC ENERGY AE309

38Hz–30kHz, 89dB osjetljivost, 115dB vršni SPL, 175W snaga, 6 ohma impedancija, 2.5-stazni dizajn, dimenzije 900×175×280 mm, masa 22 kg.

1.274 € ~~1.499 €~~ Akcija

Potpuna imerzija u zvuku.

Akcija

Soundbar BOSE Smart

Dolby Atmos, A.I. način dijaloga, Wi-Fi i Bluetooth 5.0, Bluetooth domet 30 stopa, upravljanje putem Bose aplikacije.

499 € ~~579 €~~ Akcija

Vrhunska udobnost i neusporedivi zvuk bez buke.

Akcija

BOSE QuietComfort Ultra Headphones

Bežične, ANC, Bluetooth 5.3, do 24h baterija, brzo punjenje, multipoint, adaptivni mikrofon, USB-C, Bose CustomTune, Google Fast Pair, ergonomski dizajn.

450 € ~~519 €~~ Akcija

Premium zvuk, udobnost i ANC.

Akcija

BOWERS & WILKINS PX7 S2e

Hybrid Noise Cancellation, Ambient Pass-Through, Bluetooth 5.2 s aptX Adaptive, USB-C punjenje, 2 x 40mm bio cellulose driveri, 6 mikrofona, trajanje baterije do 30 sati, brzo punjenje.

219 € ~~249 €~~ Akcija

Prirodni zvuk, visoka jasnoća i čvrst bas.

Akcija

KEF Q150

Izložbeni model, 2-way bass reflex, 86dB osjetljivost, 51Hz–28kHz frekvencijski odziv, 108dB max izlaz, 10–100W pojačalo, 8 Ohma impedancija, 130mm Uni-Q driver.

349 € ~~499 €~~ Akcija

Vrhunski zvuk za kućno kino i glazbu.

MARANTZ Cinema 70s

7.2-kanalni A/B pojačalo s 50 W po kanalu, Dolby Atmos i DTS:X, 6 HDMI ulaza (8K podrška), HEOS multi-room streaming, Bluetooth, AirPlay 2 i podrškom za Spotify, TIDAL i Amazon Music.

729,00 € Kupi

Serija Motion Foundation®.

MARTIN LOGAN Motion Foundation B1

2-smjerni zvučnik s 5,5” aluminijskim wooferom i Gen2 Folded Motion® tweeterom (0,94” x 1”). Frekvencijski raspon 48 Hz – 23 kHz, osjetljivost 89 dB, impedancija 5 Ω. Preporučena snaga pojačala 15-100 W. Dimenzije: 34,6 x 18,4 x 24 cm.

809 € Kupi

Visokoučinkovito diskretno pojačalo sa sedam kanala.

DENON AVR-X1800 DAB

Denon AVR-X1800H DAB AV receiver, 7 kanalno pojačalo, Audyssey kalibracija zvuka, FM, DAB+ i Internet radio, integriran Heos.

589 € Kupi

Novosti iz naše Hi-Fi slušaonice

Novosti

Acoustic Energy nova serija 300 - model 309.2

Acoustic Energy je nedavno predstavio evoluciju svoje srednje serije 300, sada s modelima s brojem 2 u eksponentu. 3002, 3092, veći podni zvučnici 3202 te zidni ili centralni 3072.

Kupi