Svi Googleovi proizvodi i usluge ulaze u svoju "Gemini eru", GenAI postaje sveprisutan
Na početku svoje godišnje developerske konferencije Google je još jednom potvrdio da sve karte baca na generativnu umjetnu inteligenciju, uvodeći model Gemini u tražilicu, Gmail, Photos…
Samo dan nakon što je OpenAI predstavio niz poboljšanja svojeg ChatGPT-a i s njime povezanih tehnologija, održan je i keynote na otvaranju Googleove deveoperske konferencije I/O – a i tamo je, očekivano, najveći naglasak bio na sustavima generativne umjetne inteligencije i njihova implementacija u Googleove proizvode i usluge.
"Google je potpuno ušao u svoju Gemini eru", kažu iz te kompanije, naglašavajući da će taj sustav generativne umjetne inteligencije imati vrlo istaknuto mjesto u svim njihovim uslugama, počevši s tražilicom i Gmailom, pa sve do aplikacije Photos, poslovnih aplikacija. Neke od novih mogućnosti predstavljene su već na početku konferencije I/O, iako još uvijek neće biti dostupne široj javnosti.
Jezični model Gemini
Za napredne korisnike i pretplatnike najvažnija je vijest unaprjeđenje jezičnog modela na verziju Gemini 1.5 Pro, koji je sada još bolji u prevođenju, programiranju, racionalnom "razmišljanju" i multimodalnom radu. Kako bi ga svi mogli koristiti za napredne funkcije, Google mu je dao mogućnost najvećeg na svijetu obuhvata ulaznih podataka – Gemini 1.5 u verzijama Flash i Pro može u svoj "context window" primiti do milijun tokena teksta, a uskoro će to biti prošireno i na čak 2 milijuna. K tome, pristup preko API-ja je pojeftinio, pa se developeri, čije su aplikacije vezane za Gemini, imaju čemu radovati.
GenAI u tražilici
Nastavlja se implementacija AI modela u najpoznatiji Googleov proizvod, internetsku tražilicu. Sve će više korisnika uskoro dobiti pristup do funkcije AI Overviews. Ona će im na upit postavljen pretraživaču odgovarati rezultatima koje je za njih priredila umjetna inteligencija - dakle, umjesto uobičajenih linkova na rezultate, dobit ćete odgovore na pitanja, sa slikama, linkovima i gotovim prilagođenim objašnjenjima. Sve to prvo će biti dostupno korisnicima iz SAD-a i samo na engleskom jeziku.
Nove mogućnosti tražilice uključuju i, primjerice, pomoć pri planiranju putovanja, pametnije organiziranje rezultata klasičnog pretraživanja, ali i multimodalno pretraživanje. Potonje znači da će korisnik moći snimiti kratki video ili fotografiju, pa potom Googleovoj tražilici postaviti pitanja vezana za takav multimedijalni sadržaj.
Oni, pak, kojima se ne dopadne takva promjena tražilice koju koriste svakodnevno i na kakvu su naviknuti, moći će automatski generirane odgovore i isključiti. U vrhu rezultata pretraživanja, uz kartice za slike, mape, vijesti i slično, naći će se još jedna – "web", koja će pred korisnika izbaciti samo uobičajene linkove, kao i dosad.
Ask Photos
Još jedna aplikacija, u kojoj će GenAI imati velik utjecaj, jest Photos (Fotografije). Putem nje se u Googleov oblak danas postavlja oko 6 milijardi fotografija i videa – svakog dana. S tolikom količinom materijala nije se lako snaći, pa će nova funkcija Ask Photos pomoći korisnicima u pronalaženju baš onih sadržaja koji im u danom trenutku trebaju.
Moći ćete tako, primjerice, pitati aplikaciju "Kada mi je kći naučila plivati?", a ona će pretražiti bazu vaših fotografija, prepoznati kontekst te odgovoriti na to pitanje, kako tekstom tako i fotografijama kao "dokazom". Podržana su i kompleksnija pitanja, poput "Koja mi je registracija automobila?", "Kako kći napreduje s plivanjem?", "Što smo radili za njezine rođendane proteklih godina?", "Pokaži mi najbolje fotografije iz nacionalnih parkova u kojima sam bio", i slična – a aplikacija Photos moći će na njih odgovarati korištenjem sadržaja slika, lokacijskih podataka i uz pomoć, dakako, jezičnog modela Gemini.
Kao i većina predstavljenoga, i Ask Photos do krajnjih će korisnika u eksperimentalnom obliku stići u narednim mjesecima.
Projekt Astra
Da Google ide otprilike u istom smjeru kao i OpenAI, potvrdio je i demo novog GenAI projekta osobnog asistenta, nazvan Astra. Iako je još u ranoj fazi razvoja, vidljive su konture onoga što se njime želi postići: pretvoriti mobitel u interaktivnog i "sveznajućeg" osobnog asistenta, koji vidi, čuje i razumije svoju okolinu. Na temelju tih informacija u stanju je davati odgovore, preporuke, savjete, pomagati u svakodnevnom životu, ali i u programiranju, snalaženju u prostoru i tome slično, sve korištenjem prirodnog jezika i konverzacije bez zamjetnog kašnjenja ("laga").
Gemini u Workspaceu
Pretplatnici na Googleove aplikacije iz paketa Workspace (Gmail, Docs, Drive, Slides, Sheets) dobit će već sada novi bočni panel, posvećen modelu Gemini i pametnom asistentu. Tamo će moći okrenuti funkcije kao što su generiranje teksta i prezentacija, skraćivanje dugih dokumenata, pametno pretraživanje, prevođenje teksta i slične, pokretane multimodalnim AI modelom.
Primjerice, unutar aplikacije Gmail (mobilne i na desktopu) bit će moguće tražiti od Geminija pomoć pri pronalaženju najvažnijih informacija u porukama, automatizirano pisanje prilagođenih odgovora, ili pak kontekstno snalaženje u "šumi" e-mailova.