Amazon Titan - novi model za generiranje slika pomoću umjetne inteligencije
Titan nije samostalna aplikacija nego alat na kojem programeri mogu izraditi vlastite generatore slika koje pokreće model temeljen na Amazon Bedrocku
Amazon Titan je multimodal koji se temelji na dva osnovna modela Amazon Titan Image Generator i Amazon Titan Multimodal Embeddings, objavljeno je tijekom konferencije AWS re:Invent.
"Modeli Amazon Titan uključuju 25 godina inovacija umjetne inteligencije (AI) i strojnog učenja (ML) u Amazonu i nude niz opcija visokoučinkovitih slikovnih, multimodalnih i tekstualnih modela putem potpuno upravljanog API-ja." - izjavila je Antje Barth, glavni zagovornik programera za generativni AI u AWS-u.
Titan Image Generator
Titan Image Generator može kreirati "realistične slike studijske kvalitete" uz ugrađene zaštitne mehanizme protiv toksičnosti i pristranosti. Usmjeren je na poslovnu publiku, a ne na postojeće potrošačke generatore slika kao što je OpenAI DALL-E.
Slike kreirane ovim modelom sadržavat će nevidljivi vodeni žig, "osmišljen kako bi se smanjilo širenje dezinformacija pružanjem diskretnog mehanizma za prepoznavanje slika koje je generirala umjetna inteligencija".
Model može primati upute na engleskom jeziku i razumjeti složene upute kako bi generirao relevantne slike.
Titan Multimodal Embeddings
Titan Multimodal Embeddings ima sposobnost da obrađuje i generira informacije korištenjem različitih vrsta podataka (modaliteta). To znači da je moguće poslati tekst, sliku ili kombinaciju to dvoje kao unos.
Model unosima daje semantičko značenje i povezuje odnose između podataka tj. na parovima slika-naslov.
Uz asinkroni batch API, Amazon OpenSearch Service će uskoro ponuditi konektor koji dodaje Titan Multimodal Embeddings podršku za neuronsko pretraživanje.