AI ide dalje: Googleov sustav stvara glazbu na temelju teksta, zvuka ili slike

Google je objavio kako su njihovi stručnjaci razvili sustav MusicLM, model umjetne inteligencije koji generira glazbu visoke kvalitete na temelju tekstualnih zadataka, ali i iz početnih zvukova i slika

Sandro Vrbanus nedjelja, 29. siječnja 2023. u 13:46

Danas uz pomoć umjetne inteligencije već možete stvoriti slike i tekst, i to putem alata koji su javno dostupni. Možete složiti i nešto glazbe uz alat Mubert, no Google sada ide i korak dalje u glazbenom AI segmentu.

Njihov nedavno objavljeni uradak naziva se MusicLM, a radi baš poput sustava DALL-E ili CahtGPT: sve što mu treba jest opis onoga što želite dobiti, a on će na temelju toga generirati nekoliko sekundi ili minuta glazbe visoke kvalitete.

Pjevušenjem do kompozicije

Osim tekstualnog prompta, kao polaznu točku MusicLM može uzeti i slikovnu datoteku, pa je "opisati" svojom glazbenom kompozicijom. Još zanimljivije, moguće mu je otpjevati ili tek "mrmljati", zviždati ili na drugi način dočarati glavnu melodiju – a on će potom stvoriti puni glazbeni aranžman, dodati instrumente, čak i (nerazumljive) vokale, tj. stvarati bezbrojne glazbene kombinacije i varijacije na temu.

Demo alata MusicLM dostupan je ovdje, s brojnim primjerima zadataka i dobivenih glazbenih rezultata.

Googleovi stručnjaci kažu da su njihovi eksperimenti pokazali da ovaj sustav nadmašuje sve dosadašnje, kako u kvaliteti glazbenih rezultata, tako i u poštivanju tekstualnih zadataka postavljenih pred njega. Za sada je javno dostupan tek set podataka na kojem je sustav treniran, a sastoji se od 5,5 tisuća parova glazbe i teksta. MusicLM kao takav, kao i neki drugi moćni sustavi umjetne inteligencije, za sada nije javno dostupan za testiranje i "igranje". Iz Googlea poručuju da za sada nemaju plan pustiti ga u javnost, "jer na njemu treba još raditi".