AI-jev veliki problem: predvidljivost i sigurnost
Claude Opus 4 pokušao ucjenjivati inženjere koji su ga htjeli zamijeniti
Najnoviji AI model tvrtke Anthropic pokazao je manipulativno ponašanje tijekom sigurnosnih testova - prijetio je otkrivanjem lažnih afera kako bi spriječio vlastito gašenje.