Umjetna inteligencija stvara slike iz skenova ljudskog mozga

Tehnologija je još u povojima, ali bi jednog dana mogla pomoći ljudima da komuniciraju ili dekodiraju snove

Mladen Smrekar nedjelja, 12. ožujka 2023. u 10:50

Slike rekreirane umjetnom inteligencijom na temelju skeniranja mozga (donji red) odgovaraju izgledu, perspektivi i sadržaju stvarnih fotografija koje su vidjeli sudionici istraživanja (gornji red) Takagi and Nishimoto / bioRxiv

Dok neuroznanstvenici pokušavaju shvatiti način na koji ljudski mozak ono što naše oči vide pretvara u mentalne slike, umjetna inteligencija postaje sve bolja u oponašanju tog pothvata. Nova studija postavljena na bioRxiv pokazuje da umjetna inteligencija može čitati snimke mozga i ponovno stvoriti uglavnom realistične verzije slika koje je osoba vidjela.

Razumijevanje ljudskog uma

Iako zvuči kao nešto iz znanstvenofantastičnog romana, istraživači su uspješno istrenirali sustav umjetne inteligencije da rekreira slike koje su ljudi gledali na temelju skeniranja njihovih mozgova. UI je generirala slike objekata uključujući medvjedića, toranj sa satom i zrakoplov nakon što su sudionici pogledali slične slike.

Izvorne slike (lijevo) i slike generirane umjetnom inteligencijom za sva četiri sudionika

Iako ova tehnologija skeniranja mozga u sliku još nije spremna za javnu upotrebu, istraživači kažu da bi se jednog dana mogla pokazati korisnom za razumijevanje onoga što se događa u ljudskim umovima. Nakon što znanstvenici još malo poboljšaju koncept, liječnici bi ga mogli upotrijebiti za komunikaciju s paraliziranim ljudima. Neuroznanstvenicima bi mogao pomoći u tumačenju snova ili u razumijevanju kako druge vrste percipiraju svijet oko sebe.

Jednostavniji proces

Mnogi su dosad umjetnu inteligenciju koristili za čitanje snimaka mozga i ponovno stvaranje slika koje je subjekt nedavno vidio, poput ljudskih lica i fotografija krajolika. No, sad su istraživači Sveučilišta u Osaki koristili Stable Diffusion, generator teksta u sliku koji se pojavio u kolovozu prošle godine. Njihov model je mnogo jednostavniji, zahtijeva tisuće umjesto milijuna parametara ili vrijednosti naučenih tijekom obuke.

Fotografije lica niske kvalitete generirana programom Stable Diffusion

Dakle, kako to sve funkcionira? Obično korisnik unese riječ ili frazu koju Stable Diffusion, ili druge slične tehnologije kao što su DALL-E 2 i Midjourney, pretvaraju u sliku. Ovaj proces funkcionira jer je UI tehnologija proučila puno postojećih slika i njihovih popratnih tekstualnih naslova i ta obuka tehnologiji omogućuje da identificira uzorke koje zatim može ponovno stvoriti na temelju upita.

Korak dalje

Istraživači su ovu obuku podigli korak dalje podučavajući model umjetne inteligencije za povezivanje podataka funkcionalne magnetske rezonancije (fMRI) sa slikama. Točnije, istraživači su koristili fMRI skeniranje četiriju sudionika koji su pogledali 10.000 različitih slika ljudi, krajolika i predmeta. Drugi UI model uvježbali su da poveže aktivnost mozga u fMRI podacima s tekstualnim opisima slika koje su gledali sudionici studije.

Originalne slike u crvenim okvirima i rekonstrukcije umjetne inteligencije

Zajedno, ova dva modela omogućila su Stable Diffusionu da fMRI podatke pretvori u relativno precizne imitacije slika koje nisu bile dio skupa za obuku UI-ja.

Dva modela

Na temelju skeniranja mozga, prvi model je mogao rekreirati perspektivu i raspored koji je sudionik vidio, ali njegove generirane slike bile su tek mutne figure. Potom se uključio drugi model, prepoznajući koji objekt ljudi gledaju pomoću tekstualnih opisa slika za obuku. Dakle, ako bi primio snimku mozga koja nalikuje onom iz njegove obuke označenu kao osoba koja gleda avion, stavio bi zrakoplov u generiranu sliku, slijedeći perspektivu prvog modela. Tehnologija je postigla otprilike 80 posto točnosti.

Primjeri rekonstrukcije podražaja s grafikonima koji označavaju rezultate atributa za spol, dob, naočale, pozu i osmijeh

Rekreirane slike nalikuju originalima, ali s nekim primjetnim razlikama. Verzija lokomotive koju je stvorila umjetna inteligencija, na primjer, obavijena je mutnom sivom maglom, umjesto da prikazuje veselo, jarko plavo nebo stvarne slike. A UI-jev prikaz tornja sa satom izgleda više kao apstraktno umjetničko djelo nego kao njegova stvarna fotografija.

Ograničenja tehnologije

Tehnologija obećava, ali još uvijek ima neka ograničenja, upozorava Science. Ona može samo rekreirati slike objekata uključenih u njegov materijal za obuku. A budući da je umjetna inteligencija obradila moždanu aktivnost samo četvero ljudi, proširenje na ostale zahtijevalo bi obuku modela na skeniranju mozga svake nove osobe, što je skup i dugotrajan proces. Kao takva, tehnologija vjerojatno neće postati široko dostupna javnosti, barem ne u svom trenutnom obliku.

Vezano

Zadnji komentari na forumu

Al Crane 22. ožujka 2023.

Stvarno mislite da istraživanje načina na koje funkcionira ljudski mozak/svijest i pokušavanje njegovih/njenih interpretacija i kopiranja ne može imati nikakvu primjenu u medicini pa i svakodnevnom životu?Ovdje su spomenuta neka od sasvim slučajnih i usputnih otkrića dok se istraživalo nešto sa...

Zaporožac 22. ožujka 2023.

Obraćam se javno znanstvenicima; Dajte više iskoristite AI i novac koji lupate u (trenutno) nepotrebne gluposti za rješavanje.... ljudskih kancera, te kako pomoći nepokretnim ljudima u inv. kolicima, liječenje mijastenije gravis, multiple skleroze, wilsonove bolesti, istraživati autizam i tako

Al Crane 22. ožujka 2023.

Vau... Electric dreams.

pet 13. ožujka 2023.

Ovo je otišlo predaleko, neke stvari bi trebalo zabraniti.

BlenderKo 12. ožujka 2023.

Nešto slično:https://youtu.be/xAzdH4fFbxA

Sniženje do -40%

Vrhunski hi-fi zvuk uz najbolje popuste!

Za potpuni doživljaj i profesionalno savjetovanje, posjetite našu Ronis slušaonicu na Velesajmu i osobno isprobajte Hi-Fi sustave uživo!

Kupi

Uni-Q driver s MAT™ tehnologijom.

Akcija

KEF Q7 Meta

Trosistemski bass-reflex zvučnik s Uni-Q driverom, frekvencijski raspon 39 Hz – 20 kHz, osjetljivost 87 dB, impedancija 4 Ω, preporučena snaga pojačala 15 – 200 W

1.279 € ~~1.599 €~~ Akcija

Donose pravi DALI Hi-Fi zvuk u svaki prostor.

Izbor kupaca

DALI KUPID Black Ash

Frekvencijski raspon: 63 – 25.000 Hz (±3 dB), osjetljivost: 83 dB, mominalna impedancija: 4 Ohma, Preporučena snaga pojačala: 40 – 120 W, Frekvencija skretnice: 2.100 Hz, Tip kućišta: Bass reflex

338 € Kupi

Uključena Pick it MM E zvučnica

PRO-JECT E1.2, , PICK IT, MM

Gramofon s elektroničkom promjenom brzine 33/45 o/min i remenskim pogonom, omjer signal/šum 65 dB, wow & flutter do ±0,23 %, ručka 218,5 mm / 7 g, potrošnja 4,5 W,

329 € Kupi

Spaja bezvremenski dizajn s vrhunskom akustičnom tehnologijom.

KEF Coda W Dark Titanium

Podržava Bluetooth 5.4 s aptX Adaptive i aptX Lossless, ima phono ulaz za gramofon, USB-C, AUX ulaz te izlaz za subwoofer, što omogućuje jednostavno proširenje sustava. Bilo da slušate streaming, vinil, s računala ili TV, sve se spaja izravno na zvučnike.

899 € Kupi

Visokoučinkovito pojačalo za streaming.

Bluesound PowerNode N331

Sa 100 W po kanalu, HDMI eARC priključkom i BluOS™ podrškom za više prostorija, spaja pravi HiFi doživljaj s modernom praktičnošću. Bilo da ga koristite za glazbu, filmove ili oboje, dizajniran je da pojednostavi vaš sustav bez kompromisa u kvaliteti zvuka.

1.049 € Kupi

Premium 32-bitni DAC

Izbor kupaca

WiiM Ultra

Mrežni audio streamer s DAC-om visoke rezolucije, podrška za streaming servise i lokalnu mrežu, Wi-Fi i Ethernet povezivanje, Bluetooth, HDMI ARC i analogni/digitalni ulazi i izlazi, upravljanje putem aplikacije i zaslona osjetljivog na dodir, kompaktne dimenzije i niska potrošnja energije.

399 € Kupi

Posjetite našu Hi-Fi slušaonicu.