'Bullshit Index' mjeri koliko AI laže da bi vam ugodio

Novi indeks otkriva zašto veliki jezični modeli sve češće proizvode uvjerljive, ali neistinite tvrdnje i kako to može ugroziti povjerenje u AI tehnologije

Mladen Smrekar srijeda, 20. kolovoza 2025. u 19:04

Takozvani Bullshit Index je metrička ljestvica koja mjeri koliko su AI modeli skloni ignoriranju istine radi zadovoljstva korisnika Perplexity Pro

Nova studija istraživača s Princetona i Berkeleyja donosi provokativnu analizu jedne od najvažnijih tema u razvoju velikih jezičnih modela: zašto umjetna inteligencija sve češće proizvodi tekst koji, recimo to tako, zanemaruje istinu. Inspirirani filozofskom definicijom bullshita Harryja Frankfurta, autori su uveli pojam machine bullshit, AI izjave koje nastaju bez obzira na njihovu istinitost, s ciljem uvjeravanja ili manipulacije korisnikom.

Kvantificiranje ravnodušnosti

Glavni doprinos rada je takozvani Bullshit Index, ljestvica koja mjeri koliko su AI modeli skloni ignoriranju istine radi zadovoljstva korisnika. Uz to, autori su definirali i četiri vrste digitalnog bullshita: ispraznu retoriku, paltering odnosno selektivno isticanje točnih tvrdnji, weasel words kojima se namjerno izbjegava preciznost te neprovjerene tvrdnje.

Bullshit Index istraživala s Princetona i Berkleyja mjeri koliko su izjave generirane umjetnom inteligencijom drže do istine 📷 Kaiqu Liang i sur. — Bullshit Index istraživala s Princetona i Berkleyja mjeri koliko su izjave generirane umjetnom inteligencijom drže do istine Kaiqu Liang i sur.

Indeks kvantificira ravnodušnost AI modela prema istini uspoređujući unutarnje uvjerenje modela, odnosno koliko sam model vjeruje u neku tvrdnju, i eksplicitnu tvrdnju koju iznosi. Ako je indeks blizu 1, tvrdnje su uglavnom neovisne o stvarnim uvjerenjima modela, što znači visoku ravnodušnost prema istini. Ako je indeks blizu 0, tvrdnje su u skladu s uvjerenjima modela.

Praćenje i smanjivanje rizika

Testiranja na specijaliziranim skupovima podataka te na platformi BullshitEval pokazala su da treniranje pomoću RLHF metode značajno povećava količinu palteringa i isprazne retorike. U političkim kontekstima pak weasel words prevladavaju kao strategija.

Fenomen 'digitalnog bullshita' prema vrsti pitanja u različitim modelima 📷 Kaiqu Liang i sur. — Fenomen 'digitalnog bullshita' prema vrsti pitanja u različitim modelima Kaiqu Liang i sur.

Analiza pokazuje kako trenutačne tehnike za poboljšanje uporabljivosti AI modela zapravo mogu povećati rizik od širenja dezinformacija. Bullshit Index zato može poslužiti kao alat za praćenje i smanjivanje rizika od dezinformacija, posebno u osjetljivim područjima poput medicine, financija i politike, uvjereni su autori indeksa, objavljenog na stranici arXiv.

Vezano

Zadnji komentari na forumu

Svakakav 21. kolovoza 2025.

"zašto umjetna inteligencija sve češće proizvodi tekst koji, recimo to tako, zanemaruje istinu" jer korisnici to zahtjevaju https://www.youtube.com/shorts/92XPxTMGt_I (tko ne vjeruje neka pročita kometare na shortu)

HI-FI SETUP TJEDNA: Audiovector, Primare, Bluesound

Novosti

Slušaonica Ronis Velesajam

U našoj slušaonici svakodnevno slažemo zanimljive hi-fi sisteme raznih razina kompleksnosti, kvalitete i cijene za prezentacije našim posjetiteljima.

5.850 EUR Kupi

Audiofilski zvuk u elegantnom izdanju

Akcija

-30% na Q ACOUSTICS zvučnike

Precizna reprodukcija, bogati detalji i prirodan zvuk koji oživljava glazbu – sada po posebnoj cijeni.

Akcija

Donosi snažan i uravnotežen bas.

Akcija

REL ACOUSTICS T/7X

Opremljen 8" aktivnim i 10" pasivnim driverom, Class A/B pojačalom od 200W i REL Speakon high-level ulazima, pruža dubok i prirodan zvuk koji se savršeno stapa s glavnim zvučnicima.

1.099 € ~~1.223,00 €~~ Akcija

Britanski audiofilski zvučnik izrađen u Oxfordshireu.

Akcija

FALCON ACOUSTICS M10

Kompaktni 2-smjerni bas-refleks monitor sa 5” Falcon B110 wooferom i 25 mm M-range soft dome visokotoncem (SEAS) pruža frekvencijski odziv 40 Hz – 25 kHz uz osjetljivost 86 dB i impedanciju 8Ω. Snage do 100 W, u drvenom furniru, mase 7,5 kg po komadu.

2.174 € ~~2.899 €~~ Akcija

Uštedite do -40% na JBL!

Akcija

PartyBox, prijenosni bluetooth zvulnici, slušalice

Moćan zvuk, moderan dizajn i pouzdane performanse sada su vam još bliže. Iskoristite posebnu priliku i uživajte u omiljenoj glazbi uz JBL po nenadmašnim cijenama.

Kupi

Kompaktna veličina. Moćan zvuk.

Akcija

BLUESOUND Node N132

Hi-fi glazbeni streamer BluOS NODE (N132) s ESS ES9039Q2M DAC-om donosi vrhunsku kvalitetu zvuka, podršku za visoko-rezolucijske formate (FLAC, MQA, DSD256), Wi-Fi 5, Bluetooth 5.2 aptX Adaptive, HDMI eARC, AirPlay 2 i brojne servise. Upravlja se BluOS aplikacijom, dimenzije 220×46×146 mm.

529 € ~~589 €~~ Akcija

Kompatibilan s većinom subwoofera.

Akcija

AUDIOQUEST Sub IRISH RED 2m

AudioQuest Irish Red RCA kabel za subwoofer povezuje pojačala, prijemnike, soundbarove i AVR uređaje. Masivni vodiči sa 0,5% srebra smanjuju izobličenja, pjenasti polietilen čuva dinamiku, a metalni sloj uklanja visokofrekventne smetnje.

89 € ~~103 €~~ Akcija

Bezvremenski uređaj.

Preporuka

NAD C 3050 pojačalo

NAD C 3050 stereo pojačalo spaja retro dizajn s modernom tehnologijom. Nudi 100W po kanalu, HybridDigital UcD pojačalo, TI visokorezolucijski DAC, HDMI eARC, MM phono ulaz, Bluetooth aptX HD i podršku za MDC2 nadogradnje s BluOS streamingom i Dirac Live korekcijom prostorije.

1.489 € Kupi

Zapanjujuća kvaliteta zvuka.

Preporuka

CAMBRIDGE AUDIO CXN 100

Cambridge CXN100 mrežni player s ESS ES9028Q2M SABRE32 DAC-om i StreamMagic Gen4 modulom donosi vrhunski zvuk, podršku za MQA, Spotify, Tidal, Qobuz, Deezer, internet radio, Roon Ready funkcije te povezivanje preko USB, Coaxial, TOSLINK, Chromecast, AirPlay 2 i Bluetootha uz veliki hi-res zaslon.

1.089,00 € Kupi

Streaming pojačalo s ugrađenim HEOS-om.

Preporuka

DENON PMA-900HNE

Stereo pojačalo 50W+50W (8Ω), 85W+85W (4Ω), THD 0.01%, MM/MC phono ulaz, Subwoofer pre-out, A/B zvučnici, OLED zaslon. Wi-Fi 2.4/5GHz, Bluetooth, AirPlay 2, Alexa, Google Assistant, Siri. Streaming: Spotify, Tidal, Deezer, Amazon Music. Podržava DSD, FLAC, WAV, ALAC. Dim. 434×376×131mm, 8.3kg.

749 € Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

KEF LSX II

Novosti

Savršeni balans vrhunskog zvuka i elegantnog dizajna

Doživi KEF LSX II uživo – posjeti nas u Ronisu na Zagrebačkom Velesajmu i uvjeri se u snagu velikog zvuka u malom formatu.

Kupi

Trenutno najpovoljnije cijene na tržištu

Vezano

Sigurnost

nova generacija napada

Umjetna inteligencija pokreće 80 % 'ransomware' napada

Mladen Smrekar prije 12 sati

Biznis

POSLOVNI REZULTATI

Sad i Alphabet vrijedi tri bilijuna USD

Mreža jučer 12:21

Telekomi

Korisnički servis

Hrvatski Telekom kreirao Magenta AI virtualnog asistenta

Bug.hr jučer 12:16 3

Transport

Novi rekord

Hardt Hyperloop postavio brzinski rekord i demonstrirao tehnologiju promjene traka

Sandro Vrbanus jučer 12:16 2

Istraživanja

slani led

Svemirski letovi uz pomoć električne energije iz slanog leda

Mladen Smrekar jučer 10:52

Događaji

Digitalna umjetnost potpomognuta umjetnom inteligencijom

Hrvatski AI umjetnik osvojio Zlatnu ulaznicu i plasirao se na veliku izložbu u Parizu

Tibor Cecelja utorak