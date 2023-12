Još otkako je lansiran Googleov prvi AI chatbot Bard, špekuliralo se o tome da će ga zamijeniti ili nadograditi novi model, razvijan u Googleu pod imenom Gemini. Njegovo lansiranje više je puta bilo odgađano, nedavno se čak šuškalo i da se neće dogoditi prije sljedeće godine, no ipak je došlo do njegove javne objave, barem za američko tržište, ove srijede. Google je svoj multimodalni veliki jezični model Gemini odlučio integrirati u Barda, ne mijenjajući tako ime niti adresu na kojoj se nalazi njihov glavni AI sustav.

Unutar besplatnog Barda

Gemini je, kako kažu, izravni konkurent modelu GPT-4 OpenAI-ja, koji pokreće (plaćeni) ChatGPT, a prema tvrdnjama njegovih tvoraca u stanju je pobijediti model GPT-4 u više različitih zadaća. Google je sam proveo 30 benchmark testiranja jednog i drugog modela, pri čemu je njihov Bard bio bolji u njih 30, "i to značajno", kako tvrdi Demis Hassabis, voditelj DeepMinda – Googleovog odjela koji je, uz MIT, sudjelovao na razvoju Geminija.

Bard je, kao i Gemini, sada po svojoj prirodi multimodalan, što znači da može raditi sa slikovnim formatima, zvukom, tekstom, videom, a razumije i piše programske jezike te je u stanju kombinirati informacije iz svih tih formata. Iz kompanije kažu da su odradili i niz slijepih testiranja, pri čemu su ispitanici odgovore Barda ocijenili najvišim ocjenama, u usporedbi s dostupnim konkurentima na tržištu.

Primjer multimodalnog rada

Zahvaljujući svojoj arhitekturi, koja je multimodalna iz temelja, novi bi model trebao pokazivati manje halucinacija, biti točniji u odgovorima bez obzira u kojem "modu" radio, kao i razumijevati kontekst otprilike onako kako to čine i ljudi.

Ultra, Pro i Nano

Model Gemini dolazi u tri "okusa", odnosno veličine – Ultra, Pro i Nano. Gemini Pro je model koji je već danas besplatno dostupan unutar Barda (samo na engleskom jeziku i još uvijek ne za korisnike iz EU). Najmanji model, Gemini Nano, bit će integriran u sustav mobitela Pixel 8 Pro, gdje će moći obavljati određene zadaće ograničenog dosega, dok će Gemini Ultra biti nadogradnja postojećeg Pro modela. Potonji će biti lansiran početkom sljedeće godine, također unutar Barda.

Pametno zaključivanje iz slika

No, iz Googlea najavljuju da će svoju AI ofenzivu nastaviti integriranjem novih modela umjetne inteligencije i u ostale usluge, kao što su oglasi, preglednik Chrome ili interaktivni pomoćnik Duet AI.

Za potrebe promotivnog testiranja nadograđenog Barda Google je angažirao jednog od najpopularnijih youtubera današnjice, inženjera Marka Robera, koji je izradio i video reklami za njega u svojem stilu.

Bard je, dakle, od danas dostupan na engleskom jeziku na više od 170 svjetskih tržišta, ne uključujući EU i UK (Bosna i Hercegovina je, primjerice, na listi). Razlozi za zaobilaženje spomenutih tržišta pravne su prirode, a za očekivati je da će ih Google uskoro riješiti, kao što je to bio slučaj i s prvom inačicom Barda. Gemini Pro za developere i profesionalne će korisnike biti dostupan od 13. prosinca.

Googleov Bard u varijanti potpomognutoj sustavom Gemini treniran je na posebnoj vlastitoj infrastrukturi, korištenjem naprednih čipova Cloud TPU v5p. Upitan do kada mu seže poznavanje podataka iz stvarnog svijeta, on danas odgovara da je treniran na svježim podacima, sve do 26. listopada 2023. godine. No, kao i Bard, u stanju je pristupati Internetu te odgovarati i na aktualnija pitanja.