Gemini može kreirati i glazbu uz model Lyria 3

Google je predstavio Lyria 3, napredni AI model koji korisnicima omogućuje kreiranje visokokvalitetnih glazbenih zapisa pomoću tekstualnih uputa, fotografija ili videozapisa, sve unutar sučelja Gemini AI-ja

Sandro Vrbanus četvrtak, 19. veljače 2026. u 13:15

Google je službeno započeo s uvođenjem beta verzije modela Lyria 3, najnovijeg generativnog sustava za glazbu, razvijenog unutar odjela za umjetnu inteligenciju DeepMind. Integriran izravno u aplikaciju Gemini, ovaj alat omogućit će korisnicima stvaranje 30-sekundnih audio zapisa visoke kvalitete.

Multimodalan i fleksibilan

Glavna karakteristika modela je sposobnost interpretacije širokog spektra ideja – od specifičnih žanrova i raspoloženja do internih šala. Korisnici, kao i na konkurentskim alatima, mogu kreirati glazbu jednostavnim tekstualnim opisom, pri čemu sustav automatski generira i glazbu i prateće tekstove pjesama.

Osim tekstualnih uputa, Lyria 3 podržava i multimedijski unos. Učitavanjem fotografije ili videozapisa, Gemini analizira vizualni sadržaj i pretvara ga u zvučni zapis koji odgovara ugođaju. Uz generiranu glazbu, sustav koristi i slikovni model Nano Banana za izradu originalnih naslovnica, olakšavajući dijeljenje sadržaja putem izravnih poveznica. Iako je primarni cilj alata zabava i personalizirano izražavanje, poručuju iz Googlea, on donosi značajna poboljšanja u odnosu na prethodne verzije, nudeći realističnije i glazbeno složenije skladbe uz veću kontrolu nad vokalima i tempom.

Kreativna sloboda

Model je dizajniran s fokusom na maksimalnu fleksibilnost, što uključuje visoke limite za broj znakova u uputama, omogućujući korisnicima unos svega – od kratkih haiku pjesama do emocionalnih priča. Razvojni tim ističe kako Lyria 3 nije ograničena samo na popularnu glazbu, već potiče eksperimentiranje s neuobičajenim kombinacijama instrumenata i spajanjem oprečnih žanrova. Posebna pozornost posvećena je i funkcionalnosti tekstova, pa Gemini može predložiti stihove na temelju teme ili uglazbiti već gotov tekst.

Usluga se uvodi globalno i bit će dostupna svim korisnicima postupno. Osim toga, širi se i na YouTube kreatore, kojima će Lyria 3 primarno služiti za unapređenje kvalitete pozadinske glazbe u Shorts formatima. Unutar sučelja Geminija, aktivira se u izborniku Tools, odmah uz alate za kreiranje slika, učenje, programiranje i ostale.

Sigurnosni standardi

U pogledu sigurnosti, Google naglašava da AI treba služiti kao nadopuna ljudskoj kreativnosti, a ne njezina zamjena. Kažu da izravno surađuju s umjetnicima kako bi osigurali odgovorno korištenje tehnologije. Primijenjeno je opsežno filtriranje i označavanje podataka kako bi se minimizirala prisutnost štetnog sadržaja, kao i vjerojatnost generiranja neprikladnih tekstova pjesama.

Kao ključni element transparentnosti, svi glazbeni zapisi generirani putem modela Lyria 3 sadrže SynthID tehnologiju, tj. neprimjetan "vodeni žig" koji omogućuje identifikaciju audio zapisa kreiranih ili uređenih pomoću umjetne inteligencije.