Višestruki UI modeli bolje zaključuju i daju točnije odgovore

Umjesto da usamljeni model umjetne inteligencije ponavlja sadržaj s interneta, metoda MIT-ovih inženjera aktivno potiče UI modele na izradu preciznijih i sveobuhvatnijih rješenja

Mladen Smrekar petak, 22. rujna 2023. u 06:00

Suradnja između agenata pomaže zaključivanju i činjeničnoj točnosti u velikim jezičnim modelima vecstock

"Dvije su glave bolje od jedne", kaže poslovica. Ova drevna mudrost izgleda vrijedi i kad je u pitanju umjetne inteligencije: višestruki jezični modeli koji rade u harmoniji bolji su od jednog. To su dokazali i inženjeri MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) koji su iskoristili višestruke UI sustave za međusobne rasprave i prepirke kako bi došli do najboljeg mogućeg odgovora na postavljeno pitanje.

Aktivna procjena odgovora

Srž problema s velikim jezičnim modelima (LLM) leži u nedosljednosti njihovih generiranih odgovora, što dovodi do potencijalnih netočnosti i pogrešnog zaključivanja. Novi pristup svakom agentu omogućuje aktivnu procjenu odgovora drugog agenta i koristi ovu kolektivnu povratnu informaciju za usavršavanje vlastitog odgovora.

Modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili drugi modeli 📷 MIT CSAIL — Modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili drugi modeli MIT CSAIL

Tehnički, proces se sastoji od više krugova generiranja odgovora i kritike. Svaki jezični model generira odgovor na zadano pitanje, a zatim uključuje povratne informacije od svih ostalih agenata za ažuriranje vlastitog odgovora. Ovaj iterativni ciklus kulminira konačnim rezultatom većine glasova svih rješenja modela i odražava dinamiku grupne rasprave u kojoj pojedinci pridonose postizanju jedinstvenog i dobro obrazloženog zaključka.

Značajna poboljšanja

"Ovaj pristup se ne oslanjamo na samo jedan model umjetne inteligencije. Umjesto toga, naš proces uključuje mnoštvo UI modela, od kojih svaki donosi jedinstvene uvide za rješavanje problema. Iako se njihovi početni odgovori mogu činiti skraćenim ili mogu sadržavati pogreške, ovi modeli mogu poboljšati vlastite odgovore proučavanjem odgovora koje su ponudili njihovi kolege", objašnjavaju istraživači u radu koji objavljuje arXiv.

Debata s više agenata poboljšava rasuđivanje i činjeničnu točnost 📷 MIT CSAIL — Debata s više agenata poboljšava rasuđivanje i činjeničnu točnost MIT CSAIL

Istraživanje se bavilo rješavanjem matematičkih problema, poput zadataka iz osnovne i srednje škole. Proces debate s više agenata doveo je do značajnog poboljšanja točnosti konačnih rezultata, a jezični modeli pokazali su poboljšane sposobnosti za generiranje točnih aritmetičkih procjena.

Stop halucinacijama

Ova metoda mogla bi pomoći i u rješavanju problema "halucinacija" koje često muče jezične modele. Dizajniranjem okruženja u kojem agenti međusobno propitkuju odgovore izbjegava se izbacivanje nasumičnih informacija i daje prednost činjeničnoj točnosti. Uspostavom decentraliziranog sustava u kojem više agenata komunicira i raspravlja, kažu istraživači, ovaj pristup mogao bi se primijeniti i za integraciju različitih specijaliziranih modela koji se služe govorom, videom ili tekstom.

Kombinacija ChatGPT-a i Barda može se koristiti zajedno za rješavanje teškog matematičkog problema iz osnovne škole 📷 MIT CSAIL — Kombinacija ChatGPT-a i Barda može se koristiti zajedno za rješavanje teškog matematičkog problema iz osnovne škole MIT CSAIL

Dakako, postojeći jezični modeli mogli bi imati problema s obradom vrlo dugih informacija, a sposobnosti kritike možda neće biti toliko rafinirane. Uz to, format rasprave s više agenata, inspiriran ljudskom interakcijom, tek treba uključiti složenije oblike rasprave koji pridonose inteligentnom kolektivnom donošenju odluka, kažu istraživači najavljujući daljnja poboljšanja.

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Zadnji komentari na forumu

ZovemseZoranidolazimizRijeke 22. rujna 2023.

Ovo je tekst ako netko želi testirati:Carla is downloading a 200 GB file. Normally she can download 2 GB/minute, but 40% of the way through the download, Windows forces a restart to isntall updates, which takes 20 minutes. Then Carla has to restart the download from the beginning. How load does it t...

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

50th Anniversary Limited Edition.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC monitor s Falcon B110 wooferom i T27 visokotoncem, 70Hz–20kHz, 15Ω, 82.5dB, 50–80W, Golden Madrone furnir, dimenzije 305 x 190 x 165 mm.

3.439,00 € ~~4.299,00 €~~ Akcija

Iznimne performanse i svestranost.

Akcija

PARASOUND JC3+ phono pretpojačalo

Frekvencijski raspon: 20 Hz - 20 kHz, +/- 0.2 dB, THD: < 0.01% at 1 kHz, SNR, MM > 87 dB, input shorted, IHF A-weighted > 78 dB, input shorted, unweighted

3.822,00 € ~~4.778,00 €~~ Akcija

Next Generation HDI™ valovod.

Akcija

JBL Stage 250B

5.25" poliselulozni woofer, 1" anodizirani aluminijski visokotonac s HDI™ horna valovodom, 2-smjerni sustav, skretnica na 1.7kHz, frekvencijski odziv 50Hz–25kHz (±6dB), osjetljivost 86dB, impedancija 6Ω, preporučena snaga pojačala 20–150W, bass-reflex kućište s otvorom straga

349,30 € ~~499,00 €~~ Akcija

Savršen za srednje i velike sobe.

Akcija

ACOUSTIC ENERGY AE309

2.5-sistemski zvucnici sa 130mm mid-bass jedinicama i 28mm aluminijskim visokotoncem, frekvencijski raspon 38Hz -30kHz, osjetljivost 89dB, vršni SBL 115dB, snaga 175W, crossover frekvencija 296Hz / 2.56kHz, impedancija 6 ohma.

1.189,00 € ~~1.399,00 €~~ Akcija

Bluetooth slušalice s do 24 sata trajanja baterije.

Akcija

MARLEY Positive Vibration XL

Bluetooth® 5.0 - Battery life: 32 Hours with ANC off / 26 Hours with ANC on - 40mm Hi Definition Drivers - USB-C Quick Charge 15 minute charge = 2 hours of playtime - Ultra Comfort foam ear cushions - Onboard Mic & Remote Functionality

69,98 € ~~99,00 €~~ Akcija

Aktivni zvučnik s Bluetooth aptX i NFC povezivanjem.

Akcija

WHARFEDALE DS1

100 mm bas i 20 mm visokotonac, pojačanje 7W RMS / 14W max, frekvencijski odziv 55Hz–20kHz (±3dB), osjetljivost linijskog ulaza 350mV, kontrole za glasnoću, izvor i uparivanje, 3,5 mm ulaz.

175,00 € ~~232,26 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II

Novosti

Savršeni balans vrhunskog zvuka i elegantnog dizajna

Doživi KEF LSX II uživo – posjeti nas u Ronisu na Zagrebačkom Velesajmu i uvjeri se u snagu velikog zvuka u malom formatu.

Kupi

Trenutno najpovoljnije cijene na tržištu

Vezano

Istraživanja

šokantno istraživanje

Mogu li AI modeli doista 'razumijeti' osjećaje?

Mladen Smrekar 25. lipnja 2025.

Istraživanja

Usporedba 14 LLM-ova

Neki upiti AI izazvaju 50 puta više emisija CO2 od drugih

Mladen Smrekar 19. lipnja 2025. 2

Umjetna inteligencija

"Razmišljanje"

Koliko AI „razmišlja“ kad mu kažemo da razmišlja?

Drago Galić 13. lipnja 2025. 1

Istraživanja

značaj iskustva

Zašto AI ne može razumjeti različite pojmove na ljudski način?

Mladen Smrekar 11. lipnja 2025. 7

Robotika

razmišljanje unaprijed

Novi algoritam robotima ubrzava planiranje pokreta do 100 puta

Mladen Smrekar 7. lipnja 2025.

Istraživanja

Ugljični dioksid

Tehnologija za hvatanje ugljika šest puta efikasnija s novim membranama

Drago Galić 27. svibnja 2025.