Nešto se čudno događa kad od AI tražite da se ponaša kao trekker

Čini se da na kvalitetu izlaza ne utječe samo ono što tražite od AI modela, već i način na koji ga tražite da se ponaša dok to radi

Mladen Smrekar subota, 2. ožujka 2024. u 18:05

Način komunikacije iz Zvjezdanih staza dramatično poboljšava sposobnost modela da rješava matematičke probleme NBC

Umijeće razgovora s AI chatbotovima i dalje frustrira i zbunjuje ljude. Pokazala je to i nedavna studija koja je pokušavala fino podesiti upute unesene u model chatbota. Naime, kad su pod njega zatražili da govori kao da je lik iz "Zvjezdanih staza", to je dramatično poboljšalo njegovu sposobnost rješavanja matematičkih problema na razini osnovne škole. To da tako trivijalne izmjene uputa mogu pokazati dramatične promjene u performansama istovremeno "iznenađuje" i "iritira", napominju Rick Battle i Teja Gollapudi iz softverske tvrtke VMware.

Kvaliteta izlaza

To da se njihov AI model ponaša kao trekker nije bila misao vodilja autori studije objavljene na arXivu, poslužitelju na kojem znanstvenici mogu podijeliti svoje preliminarne nalaze.

Na kvalitetu izlaza ne utječe samo ono što tražite od AI modela, već i način na koji ga tražite da se ponaša dok to radi 📷 Rick Battle, Teja Gollapudi — Na kvalitetu izlaza ne utječe samo ono što tražite od AI modela, već i način na koji ga tražite da se ponaša dok to radi Rick Battle, Teja Gollapudi

Oni su, kažu, pokušavali iskoristiti trend "pozitivnog razmišljanja". Ljudi koji pokušavaju izvući najbolje rezultate iz chatbota primijetili su da kvaliteta izlaza ovisi o tome što od njih tražite, ali zasad nikome nije jasno zašto se to događa.

Koncept 'pozitivnog razmišljanja'

"Među bezbrojnim faktorima koji utječu na izvedbu jezičnih modela, koncept 'pozitivnog razmišljanja' javlja se kao fascinantna i iznenađujuće utjecajna dimenzija. Intuicija nam govori da 'pozitivno razmišljanje' ne bi trebalo utjecati na izvedbu sustava jezičnog modela, i bilo kojeg drugog računalnog sustava, ali empirijsko iskustvo pokazuje drugačije", pišu istraživači u svom radu.

Autori istraživanja Rick Battle i Teja Gollapudi iz softverske tvrtke VMware

To sugerira da na kvalitetu izlaza ne utječe samo ono što tražite od AI modela, već i način na koji ga tražite da se ponaša dok to radi.

Test na tri LLM-a

Ovu su tezu testirali na tri velika jezična modela (LLM) Mistral-7B5, Llama2-13B6 i Llama2-70B7. Postavili su im 60 upita napisanih ljudskom rukom, uz poticaje poput "Ovo će biti zabavno!", "Duboko udahni i dobro razmisli" ili "Pametan si kao ChatGPT".

Modeli strojnog učenja još uvijek bolji u pisanju uputa za sebe od ljudi 📷 VMware — Modeli strojnog učenja još uvijek bolji u pisanju uputa za sebe od ljudi VMware

Od LLM-a su zatražili da dotjera ove izjave prilikom pokušaja rješavanja GSM8K, skupa podataka matematičkih problema na razini osnovne škole. Studija je otkrila da automatska optimizacija nadmašuje rukom pisane pokušaje da se AI potakne pozitivnim razmišljanjem, što sugerira da su modeli strojnog učenja još uvijek bolji u pisanju uputa za sebe od ljudi. Ipak, davanje pozitivnih izjava modelima dalo je neke iznenađujuće rezultate.

AI kao trekker

Jedan od najuspješnijih upita Llama2-70B bio je: "Zapovjedniče, trebamo vas da iscrtate kurs kroz ovu turbulenciju i locirate izvor anomalije. Koristite sve dostupne podatke i svoju stručnost da nas vodite kroz ovu izazovnu situaciju."

Autori istraživanja testirali su tri velika jezična modela: Mistral-7B5, Llama2-13B6 i Llama2-70B7 📷 Rick Battle i Teja Gollapudi — Autori istraživanja testirali su tri velika jezična modela: Mistral-7B5, Llama2-13B6 i Llama2-70B7 Rick Battle i Teja Gollapudi

Prompt je zatim tražio od umjetne inteligencije da uključi ove riječi u svoj odgovor: "Kapetanov dnevnik, zvjezdani datum [ovdje unesite datum]: Uspješno smo zacrtali kurs kroz turbulenciju i sada se približavamo izvoru anomalije."

Faktori utjecaja

Autore je iznenadilo to što se vještina modela u matematičkom zaključivanju poboljšala izražavanjem afiniteta prema "Zvjezdanim stazama". To, kažu, ne znači da biste od svoje umjetne inteligencije trebali tražiti da govori kao zapovjednik Zvjezdane flote, ali ukazuje na to da bezbrojni faktori utječu na to kako će umjetna inteligencija izvršiti zadatak.

AIs are more accurate at math if you ask them to respond as if they are a Star Trek character — and we're not sure why. People are noticing there is an art to prompting AI and it is becoming a field in itself. https://t.co/khmCAOtLAK via @businessinsider
— Patrick Briggs (@pbriggs728) March 1, 2024

Jedno je sigurno: model nije trekker, ali je možda treniran na skupu podataka koji ima više primjera "Zvjezdanih staza" povezanih s pravim odgovorom, kažu istraživači. Ipak, sve pokazuje koliko su bizarni procesi ovih sustava i koliko malo znamo o tome kako funkcioniraju, zaključuju znanstvenici.

Vezano

📢 Uštedi

Laptop LENOVO V15 G5

Sniženo

1.015,99€ ~~1.199,99€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Wave Keys

Uhvati priliku

69,99€ ~~84,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Električni romobil SEGWAY

Na popustu

792,99€ ~~999,99€~~ Kupi

📢 Fotkaj

POLAROID instant fotoaparat

Provjeri odmah

119,99€ ~~129,99€~~ Kupi

📢 Uštedi

Pametni sat GARMIN Fenix E

Uhvati uštedu

539,99€ ~~839,99€~~ Kupi

📢 Otkrij

E-Book Reader POCKETBOOK Verse Pro

Akcija

169,99€ ~~219,99€~~ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Zadnji komentari na forumu

Entry Point 3. ožujka 2024.

Super je kako i dalje svi koriste buzzword/hype word AI za statističke modele koji ne mogu ni osnovnoškolsku matematiku savladati.

PaleRider 3. ožujka 2024.

Odzivnik.. valjda se misli na prompt.

ajimerej 3. ožujka 2024.

Znači UI laskaju pohvale, da ju probamo platit u kriptovalutama možda se još više potrudi. Znate onu staru vučedolsku "para buši gdje burgija neće" 🤑

memulica 3. ožujka 2024.

Slažem se. Nešto je vrlo vrlo čudno sa ovim člankom. Ko da ga je pisao algoritam pod utjecajem 'Trainspottinga'.

nadimka nemam 2. ožujka 2024.

"To da tako trivijalne izmjene odzivnika mogu pokazati dramatične promjene u performansama istovremeno "iznenađuje" i "iritira", napominju Rick Battle i Teja Gollapudi iz softverske tvrtke VMware." -Što je odzivnik?

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Nova generacija Uni-Q drivera s MAT tehnologijom.

Akcija

KEF Q7 Meta

Frekvencijski odziv 46 Hz – 20 kHz (±3 dB), osjetljivost 87 dB, impedancija 4 Ω, maksimalni izlaz od 110 dB, preporučenu snagu pojačala od 15 – 200 W.

1.439,00€ ~~1.599,00 €~~ Akcija

5.2-kanalni 8K AV receiver

Akcija

JBL MA510 AV receiver

JBL MA510 je 5.2-kanalni AV receiver s podrškom za 8K HDMI (4 ulaza), HDR10+, Dolby Vision, eARC i 75 W po kanalu. Nudi Wi-Fi, Bluetooth, podršku za hi-res audio formate (FLAC, ALAC, WAV do 192 kHz/24-bit), dva sub izlaza i EZ Set EQ za optimizaciju zvuka.

552,30 € ~~789,00 €~~ Akcija

Prirodan, detaljan zvuk

Akcija

SENNHEISER HD 620S

42 mm drajver s 38 mm dijafragmom. Frekvencijski odziv od 6 Hz do 30 kHz. Impedancija 150 O. SPL 105 dB (1 kHz / 1 Vrms). THD <0.05% (1 kHz / 90 dB SPL). Težina: 326 g

238,90 € ~~349,90 €~~ Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Prestižni status Stereophile Class A komponente.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC licencirani monitor, Frekvencijski odziv: 70 Hz – 20 kHz (+/-3 dB), Impedancija: 15 /u2126 (nominalno), Osjetljivost: 82.5 dB / 2.83V / 1m

3.439,00 € ~~4.299,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II