Google u Gemini integrirao napredni AI model za uređivanje slika tekstualnim naredbama

Googleov AI sustav Gemini dobio je ovoga tjedna zanimljivu i korisnu nadogradnju. Koristeći novi model Nano Banana omogućeno je uređivanje fotografija i ilustracija samo na temelju tekstualnog opisa

Sandro Vrbanus subota, 30. kolovoza 2025. u 20:54

Google je svojem sustavu generativne umjetne inteligencije Gemini pridodao novi model za uređivanje slika razvijen unutar svojeg odjela DeepMind – nazvan Nano Banana. Riječ je o, kako navode, najbolje ocijenjenom modelu za uređivanje slika na svijetu, koji je već u ranim testiranjima izazvao veliko zanimanje. Od sada je integriran izravno u aplikaciju Gemini (dostupan u mobilnoj verziji i na webu), pružajući korisnicima veću kontrolu nad kreiranjem i izmjenom fotografija.

Zadržavanje lica i detalja

Novi model stavlja poseban naglasak na održavanje dosljednosti izgleda osoba ili kućnih ljubimaca s jedne slike na drugu. Iz tvrtke ističu kako su svjesni da kod uređivanja osobnih fotografija i najmanji detalji čine razliku, pa je stoga najnovije ažuriranje dizajnirano kako bi fotografije izgledale autentično, bez obzira na to dodaje li korisnik nekoj osobi frizuru iz 60-ih ili odijeva svog psa u kostim, kažu iz Googlea.

Korisnicima se sada u Geminiju nudi niz naprednih funkcija uređivanja slika. Moguće je učitati fotografiju osobe ili ljubimca i postaviti ih u potpuno nove scenarije, poput promjene odjeće, profesije ili čak desetljeća u kojem se nalaze, a da pritom njihov izgled ostane nepromijenjen. Omogućeno je i spajanje više fotografija u jednu scenu.

Još jedna od novosti je višestupanjsko uređivanje, koje dopušta korisnicima da postupno mijenjaju sliku, navodeći jedan tekstualni prompt za drugim. Moguće je, primjerice, krenuti od prazne sobe, obojiti zidove, zatim dodati policu za knjige, namještaj i druge detalje, pri čemu Gemini mijenja samo određene dijelove slike, čuvajući ostatak netaknutim. Uvedena je i mogućnost primjene stila jedne slike na objekt u drugoj, ili pak prenošenja tekstura s jednog objekta na drugi. Primjere pogledajte na videima unutar ovog teksta.

Ažurirana funkcionalnost za uređivanje slika dostupna je od danas svim korisnicima aplikacije Gemini diljem svijeta, bez obzira na to koriste li plaćenu ili besplatnu verziju – potonja, naravno, dolazi uz niže limite korištenja.

Kako bi se osigurala transparentnost, sve slike stvorene ili uređene uz pomoć modela Nano Banana uključivat će vidljivi vodeni žig. Uz to, slike će sadržavati i nevidljivi digitalni vodeni žig SynthID, koji služi kao jasna oznaka da je sadržaj generiran pomoću umjetne inteligencije.