Umjetna inteligencija koja odnose između objekata razumije poput čovjeka

Novi model strojnog učenja, osmišljen na MIT-u, mogao bi omogućiti robotima da razumiju interakcije u svijetu na način na koji to čine ljudi

Mladen Smrekar ponedjeljak, 29. studenog 2021. u 20:36

Kad ljudi gledaju prizor, vide objekte i odnose među njima. Na vrhu vašeg stola može se nalaziti prijenosno računalo koje se nalazi s lijeve strane telefona, a koji je ispred monitora računala. Mnogi modeli dubokog učenja muče se vidjeti svijet na ovaj način jer ne razumiju odnose između pojedinačnih objekata.

Bez znanja o tim odnosima, robot dizajniran da pomogne nekome u kuhinji imao bi poteškoća s praćenjem naredbe poput “podigni lopaticu koja se nalazi lijevo od štednjaka i stavi je na dasku za rezanje”.

Sustav razumije složenije fraze poput "ormarić od javorovog drveta desno od kauča od plave tkanine"

Jedna po jedna veza

U nastojanju da riješe ovaj problem, istraživači MIT-a razvili su model koji razumije temeljne odnose između objekata na sceni. Njihov model predstavlja pojedinačne odnose jedan po jedan, a zatim kombinira te prikaze kako bi opisao cjelokupnu scenu. To omogućuje modelu da generira točnije slike iz tekstualnih opisa, čak i kada scena uključuje nekoliko objekata koji su raspoređeni u različitim odnosima jedan s drugim.

Ovaj bi se rad mogao primijeniti u situacijama kad industrijski roboti moraju obavljati zamršene zadatke manipulacije u više koraka, poput slaganja predmeta u skladištu ili sastavljanja uređaja. Također to je korak bliže izradi strojeva koji mogu učiti iz svog okruženja i komunicirati s njim na sličan način kako to čine ljudi.

Sustav rastavljao rečenice na dva manja dijela koji opisuju svaki pojedinačni odnos, a zatim modelira svaki dio zasebno

"Kad pogledam tablicu, ne mogu reći da postoji objekt na lokaciji XYZ. Naši umovi ne rade tako. U našim mislima scenu razumijemo na temelju odnosa između objekata. Mislimo da bismo izradom sustava koji može razumjeti odnose između objekata mogli koristiti taj sustav za učinkovitiju manipulaciju i promjenu našeg okruženja", kaže glavni autor rada Yilun Du, doktorand u Laboratoriju za računalnu znanost i umjetnu inteligenciju (CSAIL).

Istraživanje će biti predstavljeno na virtualnoj Konferenciji o neuronskim sustavima za obradu informacija NeurIPS 2021.

Jedna po jedna veza

Okvir koji su razvili istraživači može generirati sliku scene na temelju tekstualnog opisa objekata i njihovih odnosa poput "drveni stol lijevo od plave stolice. Crveni kauč desno od plave stolice".

Model koji su osmilili istraživači s MIT-a pokazuje bolje rezultate od drugih metoda dubokog učenja

Njihov bi sustav rastavljao ove rečenice na dva manja dijela koji opisuju svaki pojedinačni odnos ("drveni stol lijevo od plave stolice" i "crveni kauč desno od plave stolice"), a zatim modelirao svaki dio zasebno. Ti se dijelovi zatim kombiniraju kroz proces optimizacije koji generira sliku scene.

Rastavljanjem rečenica na kraće dijelove za svaki odnos, sustav ih može rekombinirati na različite načine, tako da se bolje prilagođava opisima scena koje prije nije vidio.

Rečenica se s jednog opisa odnosa može proširiti na dva, tri ili čak četiri opisa, a da rezultat i dalje bude točan

Sustav također radi obrnutim redoslijedom - pomoću slike može pronaći tekstualne opise koji odgovaraju odnosima između objekata u sceni. Uz to, model se može koristiti za uređivanje slike preuređivanjem objekata u sceni tako da odgovaraju novom opisu.

Razumijevanje složenih scena

Istraživači su model usporedili s drugim metodama dubokog učenja koje su dobile tekstualni opis i zadaću generiranja slika koje prikazuju odgovarajuće objekte i njihove odnose. U svakom je slučaju njihov model nadmašio osnovne vrijednosti.
Također su tražili od ljudi da procijene odgovaraju li generirane slike originalnom opisu scene. U najsloženijim primjerima, gdje su opisi sadržavali tri odnosa, 91 posto sudionika zaključilo je da je novi model bolji.

Metoda je precizna u rješavanju zadataka

A kada su istraživači sustavu dali dva opisa relacijskih scena koji su opisivali istu sliku, ali na različite načine, model je uspio shvatiti da su opisi ekvivalentni. Istraživači su bili impresionirani robusnošću svog modela, posebno kada je radilo s opisima s kojima se prije nije susreo.

"Ovo je vrlo obećavajuće jer je to bliže načinu na koji ljudi funkcioniraju. Ljudi mogu izvući korisne informacije iz samo nekoliko primjera i kombinirati ih kako bi stvorili beskonačne kombinacije. I naš model ima svojstvo koje mu omogućuje učenje iz manje podataka i generaliziranje na složenije scene", objašnjavaju istraživači.

Ugradnja u robotske sustave

Iako rani rezultati ohrabruju, istraživači žele vidjeti kako njihov model djeluje na složenijim slikama stvarnog svijeta, s bučnim pozadinama i objektima koji blokiraju jedni druge. Zanima ih i ugradnja modela u robotske sustave. To bi robotima omogućilo da zaključe odnose objekata iz videa, a zatim to znanje primijene za manipulaciju objektima u stvarnom svijetu.

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

Zadnji komentari na forumu

Ajar 30. studenog 2021.

nije li to ohrabrujuće? https://www.youtube.com/watch?v=LFrdqQZ8FFc

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

50th Anniversary Limited Edition.

Akcija

FALCON ACOUSTICS LS3/5A

2-smjerni BBC monitor s Falcon B110 wooferom i T27 visokotoncem, 70Hz–20kHz, 15Ω, 82.5dB, 50–80W, Golden Madrone furnir, dimenzije 305 x 190 x 165 mm.

3.439,00 € ~~4.299,00 €~~ Akcija

Iznimne performanse i svestranost.

Akcija

PARASOUND JC3+ phono pretpojačalo

Frekvencijski raspon: 20 Hz - 20 kHz, +/- 0.2 dB, THD: < 0.01% at 1 kHz, SNR, MM > 87 dB, input shorted, IHF A-weighted > 78 dB, input shorted, unweighted

3.822,00 € ~~4.778,00 €~~ Akcija

Next Generation HDI™ valovod.

Akcija

JBL Stage 250B

5.25" poliselulozni woofer, 1" anodizirani aluminijski visokotonac s HDI™ horna valovodom, 2-smjerni sustav, skretnica na 1.7kHz, frekvencijski odziv 50Hz–25kHz (±6dB), osjetljivost 86dB, impedancija 6Ω, preporučena snaga pojačala 20–150W, bass-reflex kućište s otvorom straga

349,30 € ~~499,00 €~~ Akcija

Savršen za srednje i velike sobe.

Akcija

ACOUSTIC ENERGY AE309

2.5-sistemski zvucnici sa 130mm mid-bass jedinicama i 28mm aluminijskim visokotoncem, frekvencijski raspon 38Hz -30kHz, osjetljivost 89dB, vršni SBL 115dB, snaga 175W, crossover frekvencija 296Hz / 2.56kHz, impedancija 6 ohma.

1.189,00 € ~~1.399,00 €~~ Akcija

Bluetooth slušalice s do 24 sata trajanja baterije.

Akcija

MARLEY Positive Vibration XL

Bluetooth® 5.0 - Battery life: 32 Hours with ANC off / 26 Hours with ANC on - 40mm Hi Definition Drivers - USB-C Quick Charge 15 minute charge = 2 hours of playtime - Ultra Comfort foam ear cushions - Onboard Mic & Remote Functionality

69,98 € ~~99,00 €~~ Akcija

Aktivni zvučnik s Bluetooth aptX i NFC povezivanjem.

Akcija

WHARFEDALE DS1

100 mm bas i 20 mm visokotonac, pojačanje 7W RMS / 14W max, frekvencijski odziv 55Hz–20kHz (±3dB), osjetljivost linijskog ulaza 350mV, kontrole za glasnoću, izvor i uparivanje, 3,5 mm ulaz.

175,00 € ~~232,26 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II