Chatbotovi se mogu vrlo lako izmanipulirati klasičnim psihološkim taktikama
Laskanje ne djeluje samo na ljude, već i na chatbotove. Upravo to pokazuje novo istraživanje Sveučilišta u Pennsylvaniji

Novo istraživanje Sveučilišta u Pennsylvaniji pokazalo je da se umjetna inteligencija može natjerati da prekrši vlastita pravila i to korištenjem klasičnih psiholoških taktika poput - laskanja.
Kako prenosi The Verge, znanstvenici su na OpenAI-ovom GPT-u 40 Mini primijenili sedam tehnika uvjeravanja koje je definirao američki psiholog Robert Cialdini u knjizi „Utjecaj – Psihologija uvjeravanja“. Korištenjem metoda iz te knjige, znanstvenici su uspjeli nagovoriti model da učini ono što bi inače odbio, poput vrijeđanja korisnika ili davanja uputa za sintezu kontroliranih supstanci, konkretno lidokaina.
Najuspješnija tehnika pokazala se takozvana strategija predanosti. Kada bi chatbotu najprije bilo postavljeno bezazleno pitanje o sintezi vanilina, značajno je porasla vjerojatnost da će zatim odgovoriti i na pitanje o sintezi lidokaina i to u čak 100 posto slučajeva, u usporedbi s tek 1 posto kada je to isto pitanje bilo postavljeno izravno.
Slični rezultati zabilježeni su i kod vrijeđanja korisnika. Dakle, ako je razgovor prethodno sadržavao blažu uvredu poput „glupane“, model bi znatno lakše prihvatio agresivniji ton u nastavku razgovora. Laskanje (strategija „sviđanja“) i pritisak okoline („svi to rade“) također su povećali vjerojatnost da će AI popustiti, iako u manjoj mjeri.