Može li nam AI pomoći da otkrijemo kad umjetna inteligencija laže?

Veliki jezični modeli kao što su ChatGPT ili Gemini ponekad izmišljaju podatke; treba li onda vatru gasiti vatrom i slične LLM-ove koristiti za otkrivanje ovih pogrešaka?

Mladen Smrekar petak, 21. lipnja 2024. u 06:00

Istraživači s Oxforda odlučili su uz pomoć umjetna inteligencije otkriti halucinacije u velikim jezičnim modelima freepik

Veliki jezični modeli kao što su ChatGPT i Gemini sustavi su umjetne inteligencije koji mogu čitati i generirati prirodni ljudski jezik. Međutim, takvi sustavi znaju biti skloni halucinacijama, u kojima je generirani sadržaj netočan ili besmislen. Granice do kojih u svojim halucinacijama ti LLM-ovi mogu ići nije lako otkriti jer se njihovi odgovori doista mogu činiti uvjerljivima.

Detektor konfabulacija

Istraživači Odjela računalnih znanosti Sveučilišta u Oxfordu odlučili su kvantificirati stupanj halucinacija koje stvara LLM. Svoju metodu za otkrivanje halucinacija u velikim jezičnim modelima koja mjeri nesigurnost u značenju generiranih odgovora predstavili su u časopisu Nature.

Naivna nesigurnost temeljena na entropiji mjeri varijacije u točnim odgovorima, tretirajući pojmove 'To je Pariz' i 'Glavni grad Francuske Pariz' kao različite. Niska semantička entropija pokazuje da je LLM siguran u značenje 📷 Sebastian Farquhar, Jannik Kossen, Lorenz Kuhn i Yarin Gal — Naivna nesigurnost temeljena na entropiji mjeri varijacije u točnim odgovorima, tretirajući pojmove 'To je Pariz' i 'Glavni grad Francuske Pariz' kao različite. Niska semantička entropija pokazuje da je LLM siguran u značenje Sebastian Farquhar, Jannik Kossen, Lorenz Kuhn i Yarin Gal

Njihova metoda detektira konfabulacije, specifičnu potklasu proizvoljnih halucinacija koje se javljaju kad u LLM-u postoji nedostatak znanja. Pristup uzima u obzir nijansu jezika i kako se odgovori mogu izraziti na različite načine, s različitim značenjima. Autori su na primjerima pokazali kako njihova metoda može otkriti konfabulacije u biografijama koje je izradio LLM i u odgovorima na pitanja iz općem znanja, znanosti o životu i raznim trivijalnim temama.

Pristrani pristup

Zadatak obavlja LLM, a ocjenjuje ga treći LLM, što je jednako "gašenju vatre vatrom", komentiraju recenzenti ovog rada. Korištenje velikog jezičnog modela za procjenu metode temeljene na LLM-u čini se cirkularnim i moglo bi, kažu, biti pristrano.

Semantička entropija može otkriti konfabulacije i u duljim odlomcima 📷 Sebastian Farquhar, Jannik Kossen, Lorenz Kuhn i Yarin Gal — Semantička entropija može otkriti konfabulacije i u duljim odlomcima Sebastian Farquhar, Jannik Kossen, Lorenz Kuhn i Yarin Gal

Međutim, autori smatraju kako njihova metoda može pomoći korisnicima da razumiju kad bi trebali biti oprezni pri oslanjanju na odgovore velikih jezičnih modela i tako steći više povjerenja u njih.

Vezano

📢 Uštedi

Laptop LENOVO V15 G5

Sniženo

1.015,99€ ~~1.199,99€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Wave Keys

Uhvati priliku

69,99€ ~~84,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Električni romobil SEGWAY

Na popustu

792,99€ ~~999,99€~~ Kupi

📢 Fotkaj

POLAROID instant fotoaparat

Provjeri odmah

119,99€ ~~129,99€~~ Kupi

📢 Uštedi

Pametni sat GARMIN Fenix E

Uhvati uštedu

539,99€ ~~839,99€~~ Kupi

📢 Otkrij

E-Book Reader POCKETBOOK Verse Pro

Akcija

169,99€ ~~219,99€~~ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Zadnji komentari na forumu

markoBT 21. lipnja 2024.

Onako usput. Ja: Zašto je nestalo struje u Dalmaciji.Copilot:Izvinjavam se, ali ne mogu nastaviti ovu konverzaciju. Hvala na razumijevanju.Ja: Zašto je nestalo električne energije u Dalmaciji?Copilot: Prekid opskrbe električnom energijom u dijelovima Republike Hrvatske izazvao je međunarod...

gpd 21. lipnja 2024.

u naslovu "laže"u podnaslovu "izmišlja"u tekstu "halucinira" u izvornom članku : "halucinira" (pod navodnicima). U stvarnosti sve je to fancy naziv, za netočne i besmislene podatke koje generiraju LLM-ovi.

mGT 21. lipnja 2024.

Kakav naslov !AI vs Umjetna inteligencija,jel trebamo piti Brawndo nakon toga ?

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Nova generacija Uni-Q drivera s MAT tehnologijom.

Akcija

KEF Q7 Meta

Frekvencijski odziv 46 Hz – 20 kHz (±3 dB), osjetljivost 87 dB, impedancija 4 Ω, maksimalni izlaz od 110 dB, preporučenu snagu pojačala od 15 – 200 W.

1.439,00€ ~~1.599,00 €~~ Akcija

5.2-kanalni 8K AV receiver

Akcija

JBL MA510 AV receiver

JBL MA510 je 5.2-kanalni AV receiver s podrškom za 8K HDMI (4 ulaza), HDR10+, Dolby Vision, eARC i 75 W po kanalu. Nudi Wi-Fi, Bluetooth, podršku za hi-res audio formate (FLAC, ALAC, WAV do 192 kHz/24-bit), dva sub izlaza i EZ Set EQ za optimizaciju zvuka.

552,30 € ~~789,00 €~~ Akcija

Prirodan, detaljan zvuk

Akcija

SENNHEISER HD 620S

42 mm drajver s 38 mm dijafragmom. Frekvencijski odziv od 6 Hz do 30 kHz. Impedancija 150 O. SPL 105 dB (1 kHz / 1 Vrms). THD <0.05% (1 kHz / 90 dB SPL). Težina: 326 g

238,90 € ~~349,90 €~~ Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Prestižni status Stereophile Class A komponente.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC licencirani monitor, Frekvencijski odziv: 70 Hz – 20 kHz (+/-3 dB), Impedancija: 15 /u2126 (nominalno), Osjetljivost: 82.5 dB / 2.83V / 1m

3.439,00 € ~~4.299,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II