EfficientViT: računalni vid visoke rezolucije

MIT-ov sustav poboljšava kvalitetu slike u video streamingu i pomaže autonomnim vozilima da prepoznaju opasnosti na cesti u stvarnom vremenu

Mladen Smrekar utorak, 12. rujna 2023. u 19:30

Model strojnog učenja za računalni vid visoke rezolucije mogao bi omogućiti računalno intenzivne aplikacije vida, poput autonomne vožnje ili segmentacije medicinske slike na edge uređajima

Autonomna vozila moraju brzo i točno prepoznati objekte s kojima se susreću, a u tome im pomažu moćni modeli računalnog vida za kategorizaciju svakog piksela na slici visoke rezolucije. Suvremeni modeli semantičke segmentacije izravno uče interakciju između svakog para piksela na slici, tako da njihovi izračuni rastu kvadratno s povećanjem rezolucije slike. Iako su točni, ovi su modeli zbog toga prespori za obradu slika visoke razlučivosti u stvarnom vremenu na rubnom uređaju poput senzora ili mobilnog telefona.

Devet puta brži

No sad su istraživači s MIT-a razvili EfficientViT, učinkovitiji model koji uvelike smanjuje računsku složenost semantičke segmentacije i omogućava rad u stvarnom vremenu na uređaju s ograničenim hardverskim resursima, kao što su ugrađena računala koja autonomnom vozilu omogućuju donošenje odluka u djeliću sekunde.

Testiranje modela na skupovima podataka korištenim za semantičku segmentaciju otkrili su da EfficientViT radi do devet puta brže na Nvidijinoj grafičkoj procesorskoj jedinici (GPU) od ostalih popularnih modela transformatora vida, s istom ili boljom točnošću.

Globalno receptivno polje

Kategoriziranje svakog piksela na slici visoke rezolucije koja može imati milijune piksela težak je zadatak za transformatore vida koji su izvorno razvijeni za obradu prirodnog jezika. Oni svaku riječ u rečenici kodiraju kao token, a zatim generiraju mapu koja bilježi međusobne odnose svakog tokena i pomaže modelu razumjeti kontekst prilikom predviđanja.

Makro arhitektura EfficientViT-a 📷 MIT — Makro arhitektura EfficientViT-a MIT

Koristeći isti koncept, transformator vida sjecka sliku na dijelove piksela i kodira svaki mali dio u token prije generiranja karte. Prilikom generiranja model koristi funkciju sličnosti koja izravno uči interakciju između svakog para piksela. Tako model razvija globalno receptivno polje, što znači da može pristupiti svim relevantnim dijelovima slike.

Prilagođavanje hardveru

EfficientViT zamjenjuje funkciju nelinearne sličnosti linearnom funkcijom. Tako može preurediti redoslijed operacija kako bi smanjili ukupne izračune bez promjene funkcionalnosti i gubitka globalnog receptivnog polja. Arhitektura EfficientViT-a se prilagođava hardveru, što olakšava rad na različitim vrstama uređaja poput naglavnika za virtualnu stvarnost ili edge računala u autonomnim vozilima.

EfficientViT autonomnom vozilu omogućava učinkovitu kategorizaciju svakog piksela u sceni kako bi vozilo moglo točno identificirati objekte 📷 MIT — EfficientViT autonomnom vozilu omogućava učinkovitu kategorizaciju svakog piksela u sceni kako bi vozilo moglo točno identificirati objekte MIT

"Sad možemo dobiti najbolje od oba svijeta i smanjiti računalstvo kako bismo ga učinili dovoljno brzim da ga možemo pokrenuti na mobilnim uređajima i uređajima u oblaku", kažu istraživači koji ovom tehnikom žele ubrzali generativne modele strojnog učenja, poput onih koji se koriste za generiranje novih slika. Također žele nastaviti povećavati EfficientViT za druge zadatke vida i poboljšati kvalitetu slike u videoigrama.

Vezano

📢 Uštedi

Laptop ASUS VivoBook 15

Sniženo

449,99€ ~~489,99€~~ Kupi

📢 Uštedi

HONOR Magic 7 Lite

Uhvati priliku

349,99€ ~~399,99€~~ Kupi

📢 Uštedi

Monitor 32" SAMSUNG

Provjeri odmah

379,99€ ~~439,99€~~ Kupi

📢 Uštedi

Digitalni fotoaparat NIKON Z30 + 12-28VR

Na popustu

999,99€ ~~1.199,99€~~ Kupi

📢 Otkrij

Ruksak za laptop OCTIO Essentials MultiPack

Provjeri odmah

14,99 € ~~19,99€~~ Kupi

📢 Uštedi

Električni romobil XIAOMI Electric Scooter 4 Lite (2nd Gen)

Uhvati uštedu

299,99€ ~~359,99€~~ Kupi

📢 Otkrij

Računalo LINKS Multimedia

Saznaj više

749,99€ Kupi

📢 Otkrij

Tablet XIAOMI Redmi Pad 2

Iskoristi akciju

199,00€ ~~209,00€~~ Kupi

📢 Uštedi

Tipkovnica LOGITECH Gaming G915

Uhvati uštedu

179,99€ ~~229,99€~~ Kupi

📢 Uštedi

Miš LOGITECH Gaming G402

Akcija -43%

39,99 € ~~69,99 €~~ Kupi

📢 Uštedi

E-Book Reader KOBO

Vrući popust

169,99 € ~~199,99 €~~ Kupi

Zadnji komentari na forumu

OneSpy 12. rujna 2023.

Molio bih autore ovakvih članaka da točnije prevode vrstu modela strojnog učenja. Radi se o transformerima, odnosno transformerskim modelima, a ne transformatorima.

Novosti iz naše Hi-Fi slušaonice

Acoustic Energy AE320² – konačno stigli u Ronis Velesajam!

AE320² dolazi u elegantnom, tankom kućištu izrađenom od visokokvalitetnog RSC™ MDF-a s bitumenom koji značajno smanjuje rezonanciju, omogućujući čist i prirodan zvuk bez interferencija.

Kupi

-30% na vrhunski JBL Hi-Fi!

Akcija

JBL Stage Hi-Fi zvučnici i moćni JBL AV receivere

Zapanjujući stereo zvuk, snaga i moderan dizajn – sve što ti treba za pravi audio doživljaj u tvom domu.

Akcija

Flagship zvučnik s karbonskim driverima i RSC kabinetom.

Akcija

ACOUSTIC ENERGY Corinium tectona

3-way dizajn, 29 mm tweeter, 120 mm midrange, 2x140 mm bass, 32 Hz – 30 kHz, 92 dB, 4 ohma, 200 W, 40 kg.

6.299,00 € ~~6.999,00 €~~ Akcija

Idealne za glazbu i razgovore.

Akcija

SENNHEISER HD 620S

Dinamičke, over-ear, 6–30.000 Hz, 150 Ω, 110 dB, THD <0,05%, kabel 1,8 m, jastučići od umjetne kože.

238,90€ ~~349,90 €~~ Akcija

Iznimno dubok bas.

Akcija

SENNHEISER AMBEO

Class D pojačalo, 350W RMS, 8" woofer, frekvencijski odziv 27Hz–80Hz, Bluetooth 5.2, mono RCA ulaz, dimenzije 27,4 × 36,9 × 27,4 cm, masa 8,2 kg.

478,90 € ~~699,00 €~~ Akcija

Izuzetna jasnoća i detaljnost zvuka te dubok bas.

Akcija

BOWERS & WILKINS Px7 S3

40 mm biocelulozni driveri, DSP s integriranim DAC-om i pojačalom, Bluetooth 5.3 s aptX Lossless, Adaptive, HD i AAC kodecima, 8 mikrofona, ANC, 30 h trajanja baterije, USB-C punjenje, 7 h reprodukcije uz 15 min punjenja.

379,00 € ~~429,00 €~~ Akcija

Kompaktni high-end bookshelf zvučnici.

Akcija

REVEL M105 Performa 3

Dvostazni bookshelf zvučnici, frekvencijski raspon 56Hz–20kHz, osjetljivost 86dB, impedancija 8Ω, pojačalo 50–120W, 1" aluminijski tweeter, 5.25" aluminijski woofer, stražnji bass-reflex, crossover 2.3kHz, dimenzije 35.6 x 20 x 24.8 cm, masa 7 kg.

899,00 € ~~1.499,00 €~~ Akcija

StreamMagic Gen4 modul za steaming.

CAMBRIDGE AUDIO CXN 100

DAC ESS ES9028Q2M, podrška za PCM do 32-bit/768kHz i DSD do x512, Bluetooth 5.1, AirPlay 2, Chromecast, Roon Ready, XLR/RCA izlazi, Wi-Fi/Ethernet, potrošnja 30W, dimenzije 430 x 85 x 305 mm.

1.089,00 € Kupi

DTS Play-Fi® tehnologija.

AUDIOLAB 7000N Play

Bežični streamer s ESS ES9038Q2M DAC-om, 2.8" IPS zaslon, DTS Play-Fi, AirPlay 2, podrška za TIDAL, Qobuz, Spotify, multi-room, koaksijalni i optički izlazi, RCA, 192kHz/24-bit, THD <0.0005%, S/N >115dB, 12V trigger, LAN, dimenzije 444 x 340 x 78 mm, masa 5 kg

689,00 € Kupi

Snažno integrirano pojačalo s DAC-om.

WiiM Vibelink Amp

Klasa-D pojačalo s PFFB tehnologijom, 200W/4Ω, 100W/8Ω, DAC ESS9039Q2M, THD+N ≤0.0005%, SNR ≥120dB, frekvencijski raspon 20Hz–20kHz (±0.5dB), analogni RCA ulaz bez ADC-a, optički i koaksijalni digitalni ulazi (192kHz/24-bit), pozlaćeni zvučnički priključci, 12V trigger, auto-standby

369,00 € Kupi

KEF LSX II

Novosti

Savršeni balans vrhunskog zvuka i elegantnog dizajna

Doživi KEF LSX II uživo – posjeti nas u Ronisu na Zagrebačkom Velesajmu i uvjeri se u snagu velikog zvuka u malom formatu.

Kupi

Posjetite našu Hi-Fi slušaonicu.

Ronis Velesajam

Rezervirajte termin u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Trenutno najpovoljnije cijene na tržištu

Vezano

Istraživanja

vizualno procesiranje

AI treba učiti od pčela kako se procesiraju vizualne informacije

Drago Galić 5. srpnja 2025.

Istraživanja

Veliki Brat

Većina istraživanja računalnog vida služi za špijuniranje ljudi

Mladen Smrekar 26. lipnja 2025. 2

Umjetna inteligencija

Studentska ideja

Nova metoda restauriranja slika - s umjetnom inteligencijom do djela starih majstora

Drago Galić 25. lipnja 2025. 3

Biznis

alfa bot

Burzovni AI analitičar nadmašio ljudske brokere

Mladen Smrekar 20. lipnja 2025. 1

Tehnologije

3D model podmorja

SeaSplat, moćan alat koji uklanja učinak vode pri podvodnom snimanju

Mladen Smrekar 30. svibnja 2025.

Istraživanja

inspiriran mišjim vidom

Strojni vid koji imitira biološki

Drago Galić 25. svibnja 2025.