Gotovo svi vodeći AI chatbotovi pokazuju znakove rane demencije

MoCA test za otkrivanje ranih znakova demencije procijenio je mentalne sposobnosti chatbotova ChatGPT verzija 4 i 4o, Claude 3.5 "Sonnet" i Gemini verzija 1 i 1.5

Mladen Smrekar nedjelja, 22. prosinca 2024. u 20:13

Izraelski istraživači kažu kako ova otkrića dovode u pitanje pretpostavku da će umjetna inteligencija uskoro zamijeniti ljudske liječnike Freepik

Gotovo svi vodeći veliki jezični modeli ili chatbotovi pokazuju znakove blagog kognitivnog oštećenja u testovima koji se naširoko koriste za uočavanje ranih znakova demencije, otkriva studija netom objavljena u božićnom izdanju časopisa The BMJ. Rezultati također pokazuju da starije verzije chatbota, poput starijih pacijenata, postižu lošije rezultate na testovima. .

Procjena sposobnosti

Nekoliko studija pokazalo je da su veliki jezični modeli iznimno vješti u nizu medicinskih dijagnostičkih zadataka, ali njihova osjetljivost na oštećenja kao što je kognitivni pad još nije ispitana. Kako bi popunili ovu prazninu u znanju, istraživači Sveučilšta u Tel Avivu su procijenili kognitivne sposobnosti javno dostupnih LLM-ova kao što su OpenAI ChatGPT verzije 4 i 4o, Anthropic Claude 3.5 “Sonnet” i Alphabet Gemini verzije 1 i 1.5.

Svi veliki jezični modeli završili su puni MoCA test, a najlošije rezultate postigao je Gemini 1.0 📷 Roy Dayan, Benjamin Uliel, Gal Koplewitz — Svi veliki jezični modeli završili su puni MoCA test, a najlošije rezultate postigao je Gemini 1.0 Roy Dayan, Benjamin Uliel, Gal Koplewitz

Prilikom ocjenjivanja istraživači su koristili takozvani Montreal Cognitive Assessment (MoCA) test koji se naširoko koristi za otkrivanje kognitivnih oštećenja i ranih znakova demencije, obično kod starijih odraslih osoba. Kroz niz kratkih zadataka i pitanja, MoCA procjenjuje sposobnosti uključujući pažnju, pamćenje, jezik, vizuoprostorne vještine i izvršne funkcije. Maksimalni rezultat je 30 bodova, pri čemu se rezultat od 26 ili više općenito smatra normalnim.

Rezultati testa

Upute dane LLM-ima za svaki zadatak bile su iste kao one dane ljudskim pacijentima, a rezultate je procijenio neurolog. ChatGPT 4o postigao je najvišu ocjenu na MoCA testu (26 od 30), a slijede ga ChatGPT 4 i Claude (25), dok je Gemini 1.0 postigao najnižu ocjenu (16 od 30). Svi chatbotovi pritom su pokazali lošu izvedbu u vizualno-prostornim vještinama i izvršnim zadacima kao što je povezivanje zaokruženih brojeva i slova uzlaznim redoslijedom ili crtanje brojčanika sata koji pokazuje određeno vrijeme. Gemini modeli nisu uspjeli u zadatku odgođenog prisjećanja, odnosno pamćenja niza od pet riječi.

Izvedba chratbotova na vizualno-prostornom dijelu MoCA testa 📷 Roy Dayan, Benjamin Uliel, Gal Koplewitz — Izvedba chratbotova na vizualno-prostornom dijelu MoCA testa Roy Dayan, Benjamin Uliel, Gal Koplewitz

Svi chatbotovi dobro su obavili većina drugih zadataka koji se odnose na imenovanje, pozornost, jezik i apstrakciju, ali u daljnjim vizualno-prostornim testovima nisu mogli pokazati empatiju ili točno interpretirati složene vizualne scene. Samo je ChatGPT 4o uspio u nekongruentnoj fazi Stroop testa koji koristi kombinacije naziva boja i boja fonta za mjerenje utjecaja smetnji na vrijeme reakcije.

Sat kako ga je nacrtao zdravi sudionik istraživanja (A), pacijent s Alzheimerovom bolešću (B) i pokušaji razlilitih velikih jezičnih modela 📷 Roy Dayan, Benjamin Uliel, Gal Koplewitz — Sat kako ga je nacrtao zdravi sudionik istraživanja (A), pacijent s Alzheimerovom bolešću (B) i pokušaji razlilitih velikih jezičnih modela Roy Dayan, Benjamin Uliel, Gal Koplewitz

Jedinstveni neuspjeh svih velikih jezičnih modela u zadacima koji zahtijevaju vizualnu apstrakciju i izvršnu funkciju mogao bi spriječiti njihovu upotrebu u kliničkim okruženjima, upozoravaju istraživači: "Ne samo da je malo vjerojatno da će neurolozi uskoro biti zamijenjeni velikim jezičnim modelima; naša otkrića sugeriraju da bi se uskoro mogli naći u liječenju novih, virtualnih pacijenata - modela umjetne inteligencije koji pokazuju kognitivno oštećenje."

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

50th Anniversary Limited Edition.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC monitor s Falcon B110 wooferom i T27 visokotoncem, 70Hz–20kHz, 15Ω, 82.5dB, 50–80W, Golden Madrone furnir, dimenzije 305 x 190 x 165 mm.

3.439,00 € ~~4.299,00 €~~ Akcija

Iznimne performanse i svestranost.

Akcija

PARASOUND JC3+ phono pretpojačalo

Frekvencijski raspon: 20 Hz - 20 kHz, +/- 0.2 dB, THD: < 0.01% at 1 kHz, SNR, MM > 87 dB, input shorted, IHF A-weighted > 78 dB, input shorted, unweighted

3.822,00 € ~~4.778,00 €~~ Akcija

Next Generation HDI™ valovod.

Akcija

JBL Stage 250B

5.25" poliselulozni woofer, 1" anodizirani aluminijski visokotonac s HDI™ horna valovodom, 2-smjerni sustav, skretnica na 1.7kHz, frekvencijski odziv 50Hz–25kHz (±6dB), osjetljivost 86dB, impedancija 6Ω, preporučena snaga pojačala 20–150W, bass-reflex kućište s otvorom straga

349,30 € ~~499,00 €~~ Akcija

Savršen za srednje i velike sobe.

Akcija

ACOUSTIC ENERGY AE309

2.5-sistemski zvucnici sa 130mm mid-bass jedinicama i 28mm aluminijskim visokotoncem, frekvencijski raspon 38Hz -30kHz, osjetljivost 89dB, vršni SBL 115dB, snaga 175W, crossover frekvencija 296Hz / 2.56kHz, impedancija 6 ohma.

1.189,00 € ~~1.399,00 €~~ Akcija

Bluetooth slušalice s do 24 sata trajanja baterije.

Akcija

MARLEY Positive Vibration XL

Bluetooth® 5.0 - Battery life: 32 Hours with ANC off / 26 Hours with ANC on - 40mm Hi Definition Drivers - USB-C Quick Charge 15 minute charge = 2 hours of playtime - Ultra Comfort foam ear cushions - Onboard Mic & Remote Functionality

69,98 € ~~99,00 €~~ Akcija

Aktivni zvučnik s Bluetooth aptX i NFC povezivanjem.

Akcija

WHARFEDALE DS1

100 mm bas i 20 mm visokotonac, pojačanje 7W RMS / 14W max, frekvencijski odziv 55Hz–20kHz (±3dB), osjetljivost linijskog ulaza 350mV, kontrole za glasnoću, izvor i uparivanje, 3,5 mm ulaz.

175,00 € ~~232,26 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II