Umjetna inteligencija koja radi s pravom dozom znatiželje

Istraživači MIT-a učinili su veliki iskorak u rješavanju problema balansiranja između radoznalosti i iskorištavanja u podržanom učenju

Mladen Smrekar ponedjeljak, 14. studenog 2022. u 17:17

Znatiželja pokreće umjetnu inteligenciju da istražuje svijet. Strojevi, u nekim slučajevima, koriste podržano učenje (reinforcement learning) u kojem UI agent uči tako što je nagrađuju za dobro ponašanje i kažnjavaju za loše. Ovi se agenti bore s balansiranjem vremena provedenog u otkrivanju boljih radnji i vremena provedenog u poduzimanju radnji koje su dovele do visokih nagrada.

Prava doza znatiželje

Previše znatiželje može odvratiti agenta od donošenja dobrih odluka, dok premalo znači da nikad neće otkriti dobre odluke.

Na početku obuke sve lokacije su nove za agenta (zeleni trokut) pa su ružičasti krugovi koji predstavljaju unutarnje nagrade ravnomjerno raspoređeni po karti. Plavi krugovi predstavljaju nagrade za zadatak

U potrazi za UI agentom s pravom dozom znatiželje, istraživači iz MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) izradili su algoritam koji prevladava problem pretjerano znatiželjne umjetne inteligencije. Njihov algoritam automatski povećava znatiželju kada je to potrebno i potiskuje kad agent dobije dovoljno nadzora okoline da zna što mu je činiti.

Testiranje igara

Nakon testiranja na više od 60 videoigara, algoritam je bio uspješan i u teškim i u lakim zadacima istraživanja, dok su prethodni algoritmi mogli rješavati samo teške ili lake domene. Ovom metodom UI agenti koriste manje podataka za učenje pravila donošenja odluka.

Istraživanje je provedeno na igrama kao što je "Montezuma’s Revenge"

"Ako dobro svladate kompromis između istraživanja i eksploatacije, možete brže naučiti ispravna pravila donošenja odluka; sve manje zahtijeva mnogo podataka, što pak znači neoptimalne medicinske tretmane, manji profit za web stranice i robote koji ne mogu naučiti činiti pravu stvar", objašnjavaju istraživači.

Dvije skupine

U eksperimentima istraživači su igre kao što su "Mario Kart" i "Montezuma's Revenge" podijelili u dvije različite skupine: jednu u kojoj je nadzor bio rijedak i drugu u kojoj je nadzor bio veći.

Znatiželjni algoritam uči sporo jer čini niz stvari koje su zanimljive, ali ne pomaže agentu da uspije u igri

Algoritmi koji potiču znatiželju dobro se snalaze u scenariju u kojem se iz igre uklone sve nagrade i agentu tek na kraju priopćava koliko je dobro prošao. U slučaju kad agentu osigurate gust nadzor i niz nagrada za preskakanje cijevi, skupljanje novčića i eliminiranje neprijatelja bolje se snalazi algoritam bez znatiželje jer često biva nagrađen. Znatiželjni algoritam uči sporo jer čini niz stvari koje su zanimljive, ali ne pomaže agentu da uspije u igri.

Matematička definicija znatiželje

Međutim, timski algoritam dosljedno je dobro funkcionirao, bez obzira na okruženje u kojem se nalazio. Na MIT-u se sad žele posvetiti istraživanju prikladne metrike jer znatiželju još nitko dosad nije uspio matematički definirati.

MIT-ov algoritam ubrzava stvari: umjesto da se problem rješavao tjedan dana, sad se zadovoljavajući rezultati mogu dobiti za nekoliko sati

"Postizanje dosljedno dobrih performansi na novom problemu iznimno je izazovno. Poboljšavanjem algoritama istraživanja možemo uštedjeti trud na podešavanju algoritma", kažu istraživači koji predlažu algoritam koji podešava ravnotežu između istraživanja i eksploatacije. A njihov algoritam doista ubrzava stvari: umjesto da se problem rješavao tjedan dana, sad se zadovoljavajući rezultati mogu dobiti za nekoliko sati.

Veliki izazov

"Jedan od najvećih izazova za trenutačnu umjetnu inteligenciju i kognitivnu znanost je kako uravnotežiti istraživanje i iskorištavanje; potraga za informacijama nasuprot potrage za nagradom. Djeca to rade besprijekorno, ali je računski izazovno", objašnjavaju istraživači.

Nakon testiranja na više od 60 videoigara, algoritam je bio uspješan i u teškim i u lakim zadacima istraživanja

Njihov rad koristi impresivne nove tehnike da to postigne automatski, dizajnirajući agenta koji može sustavno uravnotežiti znatiželju o svijetu i želju za nagradom. Bit će zanimljivo vidjeti što će se dogoditi kad se takve metode počnu širiti s igara na robotske agente u stvarnom svijetu.

Vezano

🔥🎮 Lenovo LOQ 15AHP10 – prijenosnik koji spaja snagu, brzinu i stabilnost za svaki izazov!

+BUNDLE za 1€

Laptop LENOVO LOQ 15AHP10 - 83JG002WSC

Lenovo LOQ 15AHP10 donosi AMD Ryzen 200 Series snagu i NVIDIA RTX 50 GPU za pouzdan gaming u FHD rezoluciji, uz 144Hz IPS zaslon, 60Wh bateriju i napredno hlađenje za stabilne performanse.

1.299,99 € ~~1.399,99 €~~ Kupi

✨💻 Otkrij svestranost IdeaPad 5 2‑in‑1 — elegantni prijenosnik koji se pretvara u tablet i prati tvoj ritam svakog dana!

+BUNDLE za 1€

Laptop LENOVO IdeaPad 5 2-in-1 - 83KU0005SC

IdeaPad 5 2‑in‑1 nudi 16" WUXGA dodirni zaslon, snažne AMD Ryzen AI procesore, 16GB LPDDR5X memorije i 512GB SSD, uz fleksibilni 360° dizajn za rad, kreativnost i zabavu.

999,98 € ~~1.099,99 €~~ Kupi

💻 Praktičan, brz i spreman za svaki zadatak!

-13%

Laptop Lenovo Ideapad 1 - 82VG00V5SC

Lenovo Ideapad 1 s Ryzen 3, 16 GB RAM‑a i brzim 512 GB SSD‑om pruža pouzdan rad i udobno korištenje na velikom 15.6" ekranu.

499,99 € ~~579,99 €~~ Kupi

🌟💼 Lagani, brzi i pouzdani — IdeaPad Slim 3 je tvoj savršeni partner za posao, školu i putovanja!

+BUNDLE za 1€

Laptop LENOVO IdeaPad Slim 3 83K700BWSC

IdeaPad Slim 3 nudi 15.3" WUXGA zaslon, AMD Ryzen 7 snagu, 24GB DDR5 memorije i 1TB SSD, uz Wi‑Fi 6 i lagani, otporni dizajn — odličan za svakodnevne zadatke i mobilnost

629,99 € ~~699,99 €~~ Kupi

💻✨ Moderan, lagan i pouzdan, Lenovo IdeaPad Slim 3 idealan je za svakodnevni rad, učenje i multimediju.

+BUNDLE za 1€

Laptop LENOVO IdeaPad Slim 3 83ER009VSC i7-13620H/16GB/1TB/16''/W11

Lenovo IdeaPad Slim 3 nudi lagan i izdržljiv dizajn, Full HD zaslon i brze moderne procesore za udoban rad i multimediju. Uz dugotrajnu bateriju i Wi‑Fi 6, pruža stabilne performanse i mobilnost za svakodnevne zadatke.

469,99 € ~~479,99 €~~ Kupi

💻🌈 Lenovo IdeaPad 5 2‑in‑1 83KX005KSC spaja moćan Intel H‑serije procesor, vrhunski OLED zaslon i fleksibilni 360° dizajn za maksimalnu produktivnost i kreativnost.

+BUNDLE za 1€

Laptop LENOVO IdeaPad 5 2-in-1 - 83KX005KSC

IdeaPad 5 2‑in‑1 83KX005KSC nudi 14" WUXGA OLED touch ekran s 100% DCI‑P3 bojama, Intel Core i5‑13420H snagu, 16GB LPDDR5x RAM-a i 1TB SSD. Uz 360° pretvorivi dizajn, Digital Pen i Wi‑Fi 6, idealan je za rad, crtanje i multimediju u pokretu.

899,99 € ~~999,99 €~~ Kupi

Zadnji komentari na forumu

PzKpfw 14. studenog 2022.

AI/ML, rula....tko zna gdje će nas sve to dovesti!1AI/Ml neiscrpno vrelo znanja, učenja, ocean izazova, ....velik lajk za ML.

Flogistol 14. studenog 2022.

Ako mogu primijetiti, nigdje nije dana referenca na znanstveni/konferencijski recenzirani članak. Jesam li nešto propustio ili se radi o čistom marketingu?

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Profesionalno ozvučenje lokala i terasa.

Odaberi uz stručan savjet

Savjetujemo vas pri odabiru zvučnika prema veličini i tipu prostora. Poslušajte ih uživo u Ronisu Velesajam i odaberite savršeno rješenje za vaš prostor.

Kupi

Technics gramofon po top cijeni

Akcija

SL-40CBT

Gramofon Technics SL-40CBT donosi preciznu, čistu i uravnoteženu reprodukciju vinila zahvaljujući Direct Drive motoru bez jezgre, s izravnim pogonom, FG sustavu detekcije brzine i aluminijskom tanjuru od 1,26 kg

649 € ~~799 €~~ Kupi

Denon Home nova serija

Novo

Bluetooth, Wi-Fi, AirPlay 2

Za svoju cijenu, nova Denon Home serija zvučnika zaista donosi iznadprosječne performanse i tehnologiju, što ih čini jednim od najatraktivnijih i najzanimljivijih Denonovih bežičnih hi-fi rješenja do sada.

Kupi

Sennheiser Signature Sound.

Akcija

SENNHEISER Momentum Wireless 4

Max SPL: 106 dB na 1kHz/1 Vrms, THD: 0,3%, Impedancija: 60 ohm, Frekvencijski odaziv: 6 Hz - 22kHz, 3,5 mm TRRS, 60h baterije, Noise canceling, Mikrofon za pozive

199 € ~~329 €~~ Akcija

Predstavlja vrhunac FORTE-serije.

Demo

ARGON AUDIO Forte A55 MK2

Izložbeni primjerak. Aktivni zvučnik - 4 x 80 Watta - Bluetooth 5.0, aptx-HD, optički digitalni ulaz (24bit/96kHz), HDMI ARC - MM ulaz za gramofon, izlaz za subwoofer

899 € ~~1.099 €~~ Akcija

Pravi hi-fi doživljaj za filmove, glazbu i gaming.

JBL MA510

Kvalitetan kućni kino zvuk uz podršku za 4K i 8K video, Dolby Atmos i DTS:X dekodiranje, Class D pojačanje, Bluetooth i mrežni streaming te jednostavno povezivanje s televizorom, konzolama i drugim izvorima.

789 € Kupi

Snažni zvučnik za zahtjevne slušatelje.

ACOUSTIC ENERGY AE309

2.5-sistemski zvucnici sa 130mm mid-bass jedinicama i 28mm aluminijskim visokotoncem, frekvencijski raspon 38Hz -30kHz, osjetljivost 89dB, vršni SBL 115dB, snaga 175W, crossover frekvencija 296Hz / 2.56kHz, impedancija 6 ohma.

1.399 € Kupi

Preporučamo

Konferencije

20. svibnja 2026.

Budućnost prava je stigla: najavljujemo osmo izdanje konferencije LegalTech

Mreža danas 00:45

Trenutno najpovoljnije cijene na tržištu

Vezano

Komentar

Tekstualni radni zadaci

AI je za posao "jedva dovoljan", tvrdi MIT-ova studija

Davor Šuštić 9. travnja 2026. 14

Internet

Analiza pa regulacija

Španjolska lansira alat za mjerenje mržnje i algoritamske polarizacije na Internetu

Sandro Vrbanus 13. ožujka 2026. 9

3D pisači

50 centi po komadu

MIT ima 3D pisač koji ispisuje funkcionalne elektromotore u jednom koraku

Sandro Vrbanus 2. ožujka 2026.

Istraživanja

empirijski dokazi

Samo 0,7 % objašnjive AI testirano na ljudima

Mladen Smrekar 21. siječnja 2026.

Premium

RADAR

Nanoroboti - Sićušni robot upravljan AI-jem

G.K. 19. siječnja 2026.

Umjetna inteligencija

sustav ranog upozorenja

AI 'radar' otkriva suicidalni rizik prije nego što video postane viralan

Mladen Smrekar 8. siječnja 2026. 1