'Dungeons & Dragons' postaje poligon za AI agente

Veliki jezični modeli uče igrati popularnu stolnu igru kako bi se testirale njihove dugoročne sposobnosti donošenja odluka, planiranja i timskog rada

Mladen Smrekar utorak, 20. siječnja 2026. u 14:22

Sudjelujući u eksperimentu, modeli su pokazivali neobična ponašanja University of California San Diego

Složena pravila igre "Dungeons & Dragons", produžene kampanje i potreba za timskim radom idealno su okruženje za procjenu dugoročnih performansi AI agenata pokretanih velikim jezičnim modelima, uvjereni su istraživači Kalifornijskog sveučilišta u San Diegu. Na primjer, dok igraju D&D kao AI agenti, modeli moraju slijediti specifična pravila igre i koordinirati timove igrača, koji se sastoje i od AI agenata i od ljudi.

Prirodni poligon

Eksperimentom, predstavljenim na nedavnoj NeurIPS 2025 konferenciji, istraživači su pokušali riješiti jedan od glavnih izazova procjene performansi LLM-ova: nedostatak mjerila za dugoročne zadatke.

LLM-ovi su modelirali i odigrali 27 različitih scenarija odabranih iz borbenih postavki Goblin Ambush, Kennel in Cragmaw Hideout i Klarg's Cave 📷 Ziyi Zeng, Shengqi Li, Jiajun Xi, Andrew Zhu, Prithviraj Ammanabrolu — LLM-ovi su modelirali i odigrali 27 različitih scenarija odabranih iz borbenih postavki Goblin Ambush, Kennel in Cragmaw Hideout i Klarg's Cave Ziyi Zeng, Shengqi Li, Jiajun Xi, Andrew Zhu, Prithviraj Ammanabrolu

"'D&D je prirodni poligon za procjenu planiranja, pridržavanja pravila i timske strategije. Budući da se igra odvija kroz dijalog, igra otvara izravan put za interakciju čovjeka i umjetne inteligencije: agenti mogu pomagati ili se igrati s drugim ljudima“, objašnjavaju istraživači koji su svoju metodu primijenili na tri LLM-a. Claude 3.5 Haiku pokazao se najboljim i najpouzdanijim, a GPT-4 odmah iza njega. DeepSeek-V3 pokazao je najslabije rezultate.

Neobična ponašanja

U eksperimentu su sva tri LLM-a simulirala igru, a modeli su upareni s game engineom temeljenim na pravilima D&D-a koji je pružao karte i resurse za igrače te djelovao kao zaštita za minimiziranje halucinacija. Modeli su igrali jedni protiv drugih i protiv više od 2000 iskusnih D&D igrača. LLM-ovi su modelirali i odigrali 27 različitih scenarija iz borbenih postavki Goblin Ambush, Kennel in Cragmaw Hideout i Klarg's Cave.

Claude 3.5 Haiku pokazao se najboljim i najpouzdanijim, a GPT-4 odmah iza njega. DeepSeek-V3 pokazao je najslabije rezultate 📷 Ziyi Zeng, Shengqi Li, Jiajun Xi, Andrew Zhu, Prithviraj Ammanabrolu — Claude 3.5 Haiku pokazao se najboljim i najpouzdanijim, a GPT-4 odmah iza njega. DeepSeek-V3 pokazao je najslabije rezultate Ziyi Zeng, Shengqi Li, Jiajun Xi, Andrew Zhu, Prithviraj Ammanabrolu

U tom procesu, modeli su pokazivali neobična ponašanja: Goblini su počeli razvijati osobnost usred borbe, provocirajući protivnike besmislenim izjavama; Paladini su u borbi držali herojske govore, a Warlockovi su postajali izrazito dramatični, čak i u svakodnevnim situacijama.

Istraživači nisu sigurni što je uzrokovalo takvo ponašanje, ali to smatraju znakom da su modeli pokušavali igri dodati teksturu i osobnost. Sljedeći koraci uključuju simuliranje punih D&D kampanja. A sama bi se metoda, kažu, mogla primijeniti i na druge scenarije, od planiranja poslovnih strategija do višestranačkih pregovora.

Vezano

💻🌈 Lenovo Yoga 9 – premium 2‑in‑1 snaga, elegancija i vrhunske performanse za rad i uživanje bez kompromisa!

-10% + POKLON

Laptop LENOVO Yoga 9 - 83LC001HSC

Lenovo Yoga 9 ima snažan Intel U7 procesor, 16 GB RAM-a i 1 TB SSD za brz i pouzdan rad, uz 14" zaslon i fleksibilni 2‑u‑1 dizajn koji omogućuje korištenje kao laptop ili tablet za maksimalnu produktivnost i mobilnost.

2069,99 € ~~2299,99 €~~ Kupi

💻🌈 Fleksibilan i elegantan, Lenovo IdeaPad 5 2‑in‑1 savršen je za rad, kreativu i svakodnevnu produktivnost u svakom načinu korištenja.

-10% + POKLON

Laptop LENOVO IdeaPad 5 2-in-1 - 83KR006BSC

Lenovo IdeaPad 5 2‑in‑1 nudi svestranost uz 360° dizajn koji omogućuje korištenje kao laptop ili tablet. Opremljen je Intel U5 procesorom, 16 GB RAM-a i prostranim 1 TB SSD‑om za brz i učinkovit rad, dok 14" zaslon pruža odlično iskustvo za rad, kreativne zadatke i svakodnevnu upotrebu.

1069,99 € ~~1189,99 €~~ Kupi

🎮⚡ Moćan i spreman za izazove, Lenovo LOQ 15 donosi vrhunske performanse za gaming i zahtjevne zadatke bez kompromisa.

-100 € + POKLON

Laptop LENOVO LOQ 15AHP10 - 83JG002WSC

Lenovo LOQ 15AHP10 kombinira Ryzen 5 procesor, 16 GB RAM-a i 1 TB SSD za brz rad i dovoljno prostora. Uz Nvidia RTX 5050 grafiku pruža odlično gaming iskustvo i rad u zahtjevnim aplikacijama, dok optimizirano hlađenje osigurava stabilne performanse i pri većem opterećenju.

1299,99 € ~~1399,99 €~~ Kupi

💻🔥 Moderan i lagan, Lenovo IdeaPad Slim 3 donosi odličan balans snage i mobilnosti za svakodnevni rad i produktivnost.

-9%

Laptop LENOVO IdeaPad Slim 3 83K7006SSC

Lenovo IdeaPad Slim 3 s Ryzen 5 procesorom i 16 GB RAM-a nudi brz i stabilan rad u više aplikacija istovremeno. Tanak i moderan dizajn uz 512 GB SSD omogućuje brzi pristup podacima, dok je laptop odličan izbor za produktivnost, rad od kuće i svakodnevne obaveze.

569,98 € ~~629,99 €~~ Kupi

💻✨ Jednostavan, pouzdan i praktičan, Lenovo IdeaPad 1 idealan je izbor za svakodnevni rad, učenje i bezbrižno korištenje.

Laptop LENOVO Ideapad 1 - 82VG00V5SC

Lenovo IdeaPad 1 donosi pouzdane performanse za svakodnevne zadatke uz AMD Ryzen 3 procesor, 16 GB RAM-a i brzi 512 GB SSD. 15,6" zaslon pruža ugodno iskustvo rada i preglednosti, dok lagan i jednostavan dizajn čini ovaj laptop idealnim za učenje, posao i osnovnu multimediju.

579,99 € Kupi

💻💼 Svestran i pouzdan, HP 15 idealan je izbor za svakodnevni rad, učenje i multimediju.

Laptop HP 15-fc0277nm - CZ9C6EA

HP 15 kombinira AMD Ryzen 5 procesor, 16 GB RAM-a i 512 GB SSD za brz i učinkovit rad. 15,6" zaslon pruža ugodno iskustvo korištenja, dok pouzdan dizajn čini ovaj laptop odličnim izborom za svakodnevne zadatke, učenje i multimediju.

679,99 € Kupi

🎮🚀 Snažan i spreman za akciju, Acer Nitro V 15 idealan je izbor za gaming i zahtjevne zadatke bez kompromisa.

Laptop ACER Nitro V 15 - NH.QPFEX.00K

Acer Nitro V 15 ističe se po snažnim performansama uz AMD Ryzen 5 procesor, 16 GB RAM-a i 512 GB SSD, uz NVIDIA RTX grafiku za glatko igranje i zahtjevne zadatke. Robusan dizajn i učinkovito hlađenje osiguravaju stabilan rad tijekom dugih gaming i radnih sesija.

999,99 € Kupi

🎯⚡ Snažan, brz i moderan, Lenovo IdeaPad Slim 3 nudi vrhunske performanse za produktivnost, multitasking i rad bez zastoja.

Laptop LENOVO IdeaPad Slim 3 83K700BWSC

Lenovo IdeaPad Slim 3 ima Ryzen 7 snagu, 16 GB RAM-a i 1 TB SSD za iznimno brz rad i dovoljno prostora. 15,3" zaslon pruža ugodno iskustvo korištenja, dok je odličan izbor za zahtjevniji multitasking, rad i svakodnevnu produktivnost.

699,99 € Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Profesionalno ozvučenje za kafiće, terase, restorane i poslovne prostore.

Vanjski i ugradbeni zvučnici na akciji do -20%

Savjetujemo vas pri odabiru zvučnika prema veličini i tipu prostora.

Kupi

Kompaktan bežični Hi-Fi sustav.

Akcija

KEF LSX II Soundwave

11. generacija Uni-Q zvučničkih jedinica, 200 W ukupne snage, do 24-bit/384 kHz rezolucija, Wi-Fi, Bluetooth 5.0, AirPlay 2, Chromecast, HDMI ARC, USB-C, optički ulaz, 3,5 mm AUX, izlaz za subwoofer

1.159 € ~~1.450 €~~ Akcija

Hiper-realistično audio iskustvo.

Akcija

KEF XIO soundbar

5.1.2 kanalni sustav, 820 W ukupne snage, 6 x Uni-Q MX drivera, 4 x P185 LF bass drivera, Dolby Atmos, DTS:X, Wi-Fi, Bluetooth 5.3, HDMI eARC, optički ulaz, RCA izlaz za subwoofer

1.949 € ~~2.299 €~~ Akcija

Finely tuned stereo zvuk.

Akcija

SONOS ERA 100

Apple AirPlay 2, Bluetooth®, Humidity resistant, Line in, Touch controls, Trueplay™, Voice enabled, WiFi.

279 € ~~299 €~~ Akcija

Inovativni open-ear dizajn.

Akcija

BOSE Open Ear Ultra Diamond 60th Anniversary Edition

Bežične open-ear slušalice, Bluetooth 5.3, do 9 m dometa, OpenAudio tehnologija, Bose Immersive Audio, ugrađeni mikrofoni, IPX4

345 € ~~419 €~~ Akcija

Bluetooth zvučnici i slušalice.

Akcija

Bose na akciji

Odaberi nove Bose slušalice, zvučnik ili soundbar uz -20% popusta!

Kupi

Slimline stereo pojačalo s 45 W po kanalu.

Akcija

MARANTZ PM6007

2x 45 W (8 Ω), 2x 60 W (4 Ω), 20 Hz–20 kHz, HDAM-SA3, DAC AK4490, 192 kHz/24-bit, 2 optička + 1 koaksijalni ulaz, phono MM, 5 analognih ulaza, subwoofer izlaz, zvučnici A/B

499 € Kupi