AI botovi „usisavaju“ Wikipediju

Wikimedia Foundation je objavila da nemilosrdno preuzimanje podataka od strane umjetne inteligencije stvara opterećenje na Wikipedijinim poslužiteljima povećavajući promet na serverima za 50 posto od siječnja 2024. godine.

Drago Galić ponedjeljak, 7. travnja 2025. u 14:45

Robot čita "Wikipodiju" - ilustracija napravljena korištenjem AI bota...

Automatizirani botovi koji traže podatke za treniranje AI modela za LLM-ove usisavaju terabajte podataka, povećavajući promet na serverima. Zaklada ne ugošćuje samo Wikipediju, već i platforme poput Wikimedia Commons, koja nudi 144 milijuna medijskih datoteka pod otvorenim licencama. Desetljećima je ovaj sadržaj pokretao sve, od rezultata pretraživanja do školskih projekata. No od početka 2024. godine, tvrtke za umjetnu inteligenciju dramatično su povećale automatizirano preuzimanje podataka putem izravnog pretraživanja, API-ja i masovnih preuzimanja kako bi nahranile svoje gladne AI modele.

Utjecaj nije teoretski. Zaklada navodi da je kada je bivši američki predsjednik Jimmy Carter umro u prosincu 2024. godine, njegova Wikipedia stranica predvidljivo privukla milijune pregleda. No pravi stres došao je kada su korisnici istovremeno streamali 1,5-satni video debate iz 1980. godine s Wikimedia Commons. Nagli porast udvostručio je normalni mrežni promet Wikimedije, privremeno maksimalno opteretivši nekoliko njezinih internetskih veza. Wikimedijini inženjeri brzo su preusmjerili promet kako bi smanjili zagušenje, ali događaj je otkrio dublji problem: osnovna propusnost već je bila uglavnom potrošena od strane botova koji preuzimaju medije u velikim razmjerima.

Wikimedijini interni podaci objašnjavaju zašto je ova vrsta prometa tako skupa za otvorene projekte. Za razliku od ljudi, koji obično pregledavaju popularne i često predmemorirane članke, botovi pretražuju opskurne i manje pristupane stranice, prisiljavajući Wikimedijine središnje podatkovne centre da ih izravno poslužuju. Sustavi predmemoriranja dizajnirani za predvidljivo, ljudsko ponašanje pregledavanja ne funkcioniraju kada botovi čitaju cijelu arhivu bez razlike.

Kao rezultat, Wikimedia je otkrila da botovi čine 65 posto najskupljih zahtjeva prema njezinoj osnovnoj infrastrukturi unatoč tome što čine samo 35 posto ukupnih pregleda stranica.

Situaciju otežava činjenica da se mnogi AI-fokusirani crawleri ne pridržavaju utvrđenih pravila. Neki ignoriraju robots.txt direktivu, drugi lažiraju korisničke agente preglednika kako bi se maskirali kao ljudski posjetitelji, a treći rotiraju IP adrese kako bi izbjegli blokiranje.

Diljem interneta, otvorene platforme eksperimentiraju s tehničkim rješenjima: izazovi dokaza o radu, spore-odgovore tarpits (poput Nepenthesa), suradničke liste za blokiranje crawlera (poput "ai.robots.txt"), i komercijalni alati poput Cloudflareovog AI Labirinta. Ovi pristupi rješavaju tehnički nesklad između infrastrukture dizajnirane za ljudske čitatelje i industrijskih zahtjeva AI treninga.

Vezano

📢 Uštedi 24%

LOGITECH G29 Driving Force Racing Wheel

Sniženo

249,99€ ~~329,99€~~ Kupi

📢 Uštedi 33%

Miš LOGITECH Gaming G502 Hero RGB

Provjeri odmah

59,99 € ~~89,99€~~ Kupi

📢 Otkrij

Monitor 24" DELL P2425

Akcija

199,99€ Kupi

📢Uštedi 19%

HONOR Magic 7 Lite

Iskoristi akciju i pokupi poklon HONOR Watch 2i

299,99€ ~~369,99€~~ Kupi

📢 Uštedi 33%

Tablet BLACKVIEW Tab 60

Provjeri odmah

99,99€ ~~149,99€~~ Kupi

📢 Uštedi 8%

Laptop LENOVO IdeaPad Slim 3

Sniženo

599,99€ ~~649,99€~~ Kupi

📢 Uštedi 30%

Pametni sat HIFUTURE Apex

Iskoristi akciju

69,99€ ~~99,99€~~ Kupi

📢 Uštedi 22%

Dječji pametni sat SMART360 Botslab Kids Watch E3

Iskoristi akciju

69,99€ ~~89,99€~~ Kupi

Zadnji komentari na forumu

warhammer 8. travnja 2025.

Prirodne znanosti Wikipedije su korektno odrađene ali društvene su katastrofa , unakažene mitomanijom raznih suprostavljenih tabora

Psiho246 8. travnja 2025.

Imam ja nesto za usisati.

Crljo 7. travnja 2025.

Sigurno će to ai firme vratiti wikipediji u obliku donacija, pošto su oni neprofitabilna organizacija?!

KIKI3ooo 7. travnja 2025.

Trenutno nema antibot sustava koji može zaustavit scrapanje. Otežat da, istiskivat veće troškove infrastrukture za scrapanje da, ali u potpunosti zaustavit ne. Wiki je tek sad "upao u tu igru" i praktički im serviraju sve na pladnju. Imaš startupe koji te otključavaju u roku 24 sata, koja nude rješe...

OneSpy 7. travnja 2025.

Vidim Drago se priklonio kontra-AI taboru. Samo danas je 3 članka u tom duhu napisao + onaj u Bugu.

HI-FI SETUP TJEDNA: Denon, JBL

Novosti

Slušaonica Ronis Velesajam

U našoj slušaonici svakodnevno slažemo zanimljive hi-fi sisteme raznih razina kompleksnosti, kvalitete i cijene za prezentacije našim posjetiteljima.

2.277 EUR Kupi

Flagship prestižne serije 100.

Akcija

ACOUSTIC ENERGY AE120²

Zvučnik 3-smjerni, 130mm papirnati wooferi, 25mm kupolasti visokotonac, frekv. raspon 39Hz–26kHz, osjetljivost 90dB, max 200W, impedancija 6Ω, SPL 116dB, crossover 300Hz/2.7kHz.

956 € ~~1.062 €~~ Akcija

Nagrađivani wireless speaker sustav.

Akcija

KEF LSX II

Bežični Hi-Fi zvučnici 2-smjerni s Uni-Q driverom (19mm Al dome, 115mm Mg/Al cone), raspon 49Hz–47kHz, pojačalo 70W+30W Class D, max SPL 102dB. Podrška za AirPlay2, Chromecast, Spotify, Tidal, hi-res do 384kHz/24bit. Dim. 240×155×180mm, težina seta 7,2kg.

999 € ~~1.399 €~~ Akcija

Zvuk visoke rezolucije s naprednim DSP-om.

Akcija

BOWERS & WILKINS Px8

Flagship noise-cancelling bežicne naglavne slušalice, 2x 40mm karbonske pogonske jedinice, 24 bit DSP, ugradeno 6 mikrofona, aptX Adaptive Bluetooth, 30 sati reprodukcije

449 € ~~479 €~~ Akcija

Kompaktna veličina. Moćan zvuk.

Akcija

ARGON AUDIO 1 DAB

DAB band: band III, L-band (ukljucujuci DAB +), Zaslon: 2 reda OLED, FM: 87,5-108 MHz, Ulaz/Izlaz: Stereo In/Out (Mini Jack), izlaz za slušalice, Funkcija mirovanja i tipka za odgodu

119 € ~~159 €~~ Akcija

Prilagodite svoje slušno iskustvo.

Akcija

SENNHEISER ACCENTUM PLUS

rzo punjenje: 10 minuta ukljucivanja za 5 sati reprodukcije, Sennheiser Signature Sound, Adaptivni hibridni ANC, 50-satno vrijeme reprodukcije na bateriji, Personalizacija zvuka

148,90 € ~~229,90 €~~ Akcija

Ultimativni 3D zvuk.

Akcija

SAMSUNG Music Frame HW-LS60D/EN

2 Ch, Dolby ATMOS, Q- Symphony, One Remote Control, Wireless Dolby Atmos, Spotify Connect, HDMI, Wi-Fi, Bluetooth, HDMI In 1 / Out 1 (eARC), Optical In 1, (Š x V x D): 35,30 x 36,48 x 14,34 cm

299 € ~~449 €~~ Akcija

Kompatibilan s većinom subwoofera.

Akcija

AUDIOQUEST Sub IRISH RED 2m

AudioQuest Irish Red RCA kabel za subwoofer povezuje pojačala, prijemnike, soundbarove i AVR uređaje. Masivni vodiči sa 0,5% srebra smanjuju izobličenja, pjenasti polietilen čuva dinamiku, a metalni sloj uklanja visokofrekventne smetnje.

89 € ~~103 €~~ Akcija

Bezvremenski uređaj.

Preporuka

NAD C 3050 pojačalo

NAD C 3050 stereo pojačalo spaja retro dizajn s modernom tehnologijom. Nudi 100W po kanalu, HybridDigital UcD pojačalo, TI visokorezolucijski DAC, HDMI eARC, MM phono ulaz, Bluetooth aptX HD i podršku za MDC2 nadogradnje s BluOS streamingom i Dirac Live korekcijom prostorije.

1.489 € Kupi

Zapanjujuća kvaliteta zvuka.

Preporuka

CAMBRIDGE AUDIO CXN 100

Cambridge CXN100 mrežni player s ESS ES9028Q2M SABRE32 DAC-om i StreamMagic Gen4 modulom donosi vrhunski zvuk, podršku za MQA, Spotify, Tidal, Qobuz, Deezer, internet radio, Roon Ready funkcije te povezivanje preko USB, Coaxial, TOSLINK, Chromecast, AirPlay 2 i Bluetootha uz veliki hi-res zaslon.

1.089,00 € Kupi

Streaming pojačalo s ugrađenim HEOS-om.

Preporuka

DENON PMA-900HNE

Stereo pojačalo 50W+50W (8Ω), 85W+85W (4Ω), THD 0.01%, MM/MC phono ulaz, Subwoofer pre-out, A/B zvučnici, OLED zaslon. Wi-Fi 2.4/5GHz, Bluetooth, AirPlay 2, Alexa, Google Assistant, Siri. Streaming: Spotify, Tidal, Deezer, Amazon Music. Podržava DSD, FLAC, WAV, ALAC. Dim. 434×376×131mm, 8.3kg.

749 € Kupi

Posjetite našu Hi-Fi slušaonicu.