Duboke neuronske mreže ne vide svijet kako ga mi vidimo

Slike koje ljudi percipiraju kao potpuno nepovezane mogu se klasificirati kao iste pomoću računalnih modela

Mladen Smrekar srijeda, 18. listopada 2023. u 19:02

Neuroznanstvenici s MIT-a otkrili su da računalni modeli sluha i vida mogu izgraditi vlastite idiosinkratske "nepromjenjivosti" — što znači da reagiraju na isti način na podražaje s vrlo različitim značajkama MIT News

Ljudski osjetilni sustavi vrlo su dobri u prepoznavanju predmeta koje vidimo ili riječi koje čujemo, čak i ako je predmet naopačke ili je riječ izgovorena glasom koji nikada nismo čuli. Duboke neuronske mreže mogu se uvježbati da rade istu stvar, ispravno identificiraju sliku psa bez obzira na boju njegovog krzna ili riječ bez obzira na visinu govornikova glasa. Međutim, nova studija neuroznanstvenika s MIT-a otkriva da ti modeli često na isti način reagiraju i na slike ili riječi koje nemaju nikakve sličnosti s metom.

Reakcije neuronskih mreža

Kad su te neuronske mreže korištene za generiranje slike ili riječi na koje su reagirale na isti način kao na određeni prirodni unos, poput slike medvjeda, većina njih je generirala slike ili zvukove neprepoznatljive ljudskim promatračima. To sugerira da ovi modeli grade svoje vlastite specifične "nepromjenjivosti", što znači da reagiraju na isti način na podražaje s vrlo različitim značajkama.

Kad su neuronske mreže zamoljene da generiraju sliku ili riječ koju bi stavile u istu kategoriju kao i određeni unos, poput slike medvjeda, većina onoga što su proizvele bila je neprepoznatljiva ljudskim promatračima. Desno je primjer onoga što je model kategorizirao kao "medvjed" 📷 MIT — Kad su neuronske mreže zamoljene da generiraju sliku ili riječ koju bi stavile u istu kategoriju kao i određeni unos, poput slike medvjeda, većina onoga što su proizvele bila je neprepoznatljiva ljudskim promatračima. Desno je primjer onoga što je model kategorizirao kao "medvjed" MIT

Nalazi, predstavljeni u časopisu Nature Neuroscience, nude istraživačima novi način da procijene koliko dobro ovi modeli oponašaju organizaciju ljudske osjetilne percepcije, kaže Josh McDermott, izvanredni profesor mozga i kognitivnih znanosti na MIT-u i član McGovernovog instituta za istraživanje mozga i Centra za mozak, umove i strojeve (CBMM).

Zanemarivanje značajki

Posljednjih su godina istraživači istrenirali duboke neuronske mreže koje mogu analizirati milijune ulaznih podataka, zvukova ili slika, i naučiti zajedničke značajke koje im omogućuju da klasificiraju ciljnu riječ ili objekt približno jednako točno kao što to čine ljudi. Ovi modeli trenutno se smatraju vodećim modelima bioloških senzornih sustava.

Primjeri modela metamera generiranih regularizacijom 📷 MIT — Primjeri modela metamera generiranih regularizacijom MIT

Vjeruje se da ljudski osjetilni sustav nauči zanemariti značajke koje nisu relevantne za temeljni identitet objekta, poput količine svjetla koja ga obasjava ili iz kojeg kuta se gleda. To je poznato kao nepromjenjivost, što znači da se objekti percipiraju kao isti čak i ako pokazuju razlike u tim manje važnim značajkama.

Koncept metamera

Istraživači su se pitali mogu li duboke neuronske mreže koje su osposobljene za obavljanje zadataka klasifikacije razviti slične invarijantnosti i ove modele upotrijebili za generiranje podražaja koji proizvode istu vrstu odgovora unutar modela. Oni te podražaje nazivaju "model metamera"; koncept je izvorno razvijen za proučavanje ljudske percepcije kako bi se opisale boje koje izgledaju identično iako se sastoje od različitih valnih duljina svjetlosti.

Metameri iz klasičnog modela vida 📷 MIT — Metameri iz klasičnog modela vida MIT

Većina slika i zvukova proizvedenih na ovaj način ne izgleda i ne zvuči nimalo poput primjera koje su modeli izvorno dobili. Te su slike obična gomila nasumičnih piksela, a zvukovi nerazumljiv šum.

"Ljudi ih zapravo uopće ne mogu prepoznati. Ne izgledaju niti zvuče prirodno i nemaju protumačive karakteristike koje bi osoba mogla koristiti za klasificiranje predmeta ili riječi," objašnjavaju istraživači. Nalazi sugeriraju da su modeli nekako razvili vlastite invarijantnosti koje se razlikuju od onih u ljudskim perceptivnim sustavima.

Kontradiktorni trening

Čini se da svaki model razvija vlastitu jedinstvenu invarijantnost. Kad su metameri iz jednog modela prikazani drugom modelu, metameri su bili jednako neprepoznatljivi drugom modelu kao što su bili i ljudskim promatračima.

Modeli metamera su neprepoznatljivi ljudima čak i uz alternativne postupke obuke 📷 MIT — Modeli metamera su neprepoznatljivi ljudima čak i uz alternativne postupke obuke MIT

Metameri modela mogu postati prepoznatljiviji ljudima upotrebom kontradiktornog treninga, izvorno razvijenog za borbu protiv još jednog ograničenja modela prepoznavanja objekata po kojem uvođenje gotovo neprimjetnih promjena na sliku može dovesti do toga da je model pogrešno prepozna. Ovaj oblik treninga ima veliki učinak, ali istraživači ne znaju zašto. To će, kažu, biti tema budućih istraživanja.

Vezano

📢 Uštedi

Laptop LENOVO V15 G5

Sniženo

1.015,99€ ~~1.199,99€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Wave Keys

Uhvati priliku

69,99€ ~~84,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Električni romobil SEGWAY

Na popustu

792,99€ ~~999,99€~~ Kupi

📢 Fotkaj

POLAROID instant fotoaparat

Provjeri odmah

119,99€ ~~129,99€~~ Kupi

📢 Uštedi

Pametni sat GARMIN Fenix E

Uhvati uštedu

539,99€ ~~839,99€~~ Kupi

📢 Otkrij

E-Book Reader POCKETBOOK Verse Pro

Akcija

169,99€ ~~219,99€~~ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Nova generacija Uni-Q drivera s MAT tehnologijom.

Akcija

KEF Q7 Meta

Frekvencijski odziv 46 Hz – 20 kHz (±3 dB), osjetljivost 87 dB, impedancija 4 Ω, maksimalni izlaz od 110 dB, preporučenu snagu pojačala od 15 – 200 W.

1.439,00€ ~~1.599,00 €~~ Akcija

5.2-kanalni 8K AV receiver

Akcija

JBL MA510 AV receiver

JBL MA510 je 5.2-kanalni AV receiver s podrškom za 8K HDMI (4 ulaza), HDR10+, Dolby Vision, eARC i 75 W po kanalu. Nudi Wi-Fi, Bluetooth, podršku za hi-res audio formate (FLAC, ALAC, WAV do 192 kHz/24-bit), dva sub izlaza i EZ Set EQ za optimizaciju zvuka.

552,30 € ~~789,00 €~~ Akcija

Prirodan, detaljan zvuk

Akcija

SENNHEISER HD 620S

42 mm drajver s 38 mm dijafragmom. Frekvencijski odziv od 6 Hz do 30 kHz. Impedancija 150 O. SPL 105 dB (1 kHz / 1 Vrms). THD <0.05% (1 kHz / 90 dB SPL). Težina: 326 g

238,90 € ~~349,90 €~~ Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Prestižni status Stereophile Class A komponente.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC licencirani monitor, Frekvencijski odziv: 70 Hz – 20 kHz (+/-3 dB), Impedancija: 15 /u2126 (nominalno), Osjetljivost: 82.5 dB / 2.83V / 1m

3.439,00 € ~~4.299,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II