Korak u očuvanju digitalnog naslijeđa: Google pretraživanje i Wayback Machine udružuju snage

Google, kroz sučelje svoje tražilice, u suradnji s Internetskom arhivom Wayback Machine, otvara prozor u prošlost interneta i omogućuje budućim generacijama pristup milijardama arhiviranih web stranica

Ivan Podnar četvrtak, 12. rujna 2024. u 11:03
📷 Ilustracija: PikasoAI
Ilustracija: PikasoAI

Kako očuvati digitalne sadržaje na webu, tema je čestih rasprava, pa je dobrodošla vijest da Google pretraživanje uvodi novu funkcionalnost koja korisnicima diljem svijeta omogućuje izravan pristup arhiviranim verzijama web stranica. Tako se, suradnjom s Wayback Machine, otvara prozor u prošlost interneta direktno kroz sučelje Google pretraživanja. 

Integracija u Google pretraživanje

Nova značajka integrirana je u postojeće korisničko sučelje Google pretraživanja. Korisnici mogu pristupiti arhiviranim verzijama web stranica kroz opciju "O izvoru" koja se pojavljuje uz svaki rezultat pretraživanja. Unutar tog panela, odabirom "Više o ovoj stranici", korisnici otvaraju novu stranicu a na dnu dobivaju izravnu poveznicu na Wayback Machine:  "Pogledajte prethodne verzije na Internetska arhiva - Wayback Machine"

Mark Graham, direktor Wayback Machinea, objašnjava važnost ove inicijative: "Web stari, a s njime bezbrojna URL-ovi sada vode do digitalnih duhova. Tvrtke se zatvaraju, vlade se mijenjaju, katastrofe pogađaju, a sustavi za upravljanje sadržajem evoluiraju - sve to briše dijelove online povijesti. Ponekad sami stvaratelji sadržaja odluče izbrisati ga ili popuste pod političkim pritiscima. Wayback Machine već više od 25 godina čuva snimke javnog weba iomogucuje putovanje kroz internetsku povijest."

Wayback Machine: arhiv internetske povijesti

Wayback Machine, vrijedan resurs u očuvanju digitalne baštine, pohranjuje trenutno više od 835 milijardi web stranica na 484 jezika, spremljenih u 100 petabajta podataka. Ovaj broj kontinuirano raste, pri čemu se tjedno arhivira između 3 i 5 milijardi web stranica. Frekvencija arhiviranja varira ovisno o važnosti i popularnosti web stranica. Međutim, linkovi na arhivirane web stranice neće biti dostupna u slučajevima kada je nositelj prava odlučio ne arhivirati svoju stranicu ili ako web stranica krši pravila o sadržaju.

Popularne i važne stranice arhiviraju se češće, ponekad i više puta dnevno, dok se manje posjećene stranice arhiviraju nekoliko puta godišnje. Wayback Machine koristi posebno razvijene "web crawlere" za automatsko pretraživanje i arhiviranje web stranica, pri čemu se primjenjuju složeni algoritmi za određivanje učestalosti arhiviranja pojedinih stranica.

Najstarija arhivirana stranica datira iz 1996. godine, iz ranih dana World Wide Weba.

Povijest, struktura i tehnička pozadina

Wayback Machine su osnovali Brewster Kahle i Bruce Gilliat te registrirali kao neprofitnu organizaciju Internet Archive. Financiranje ovog projekta dolazi iz raznih izvora. Uz donacije pojedinaca, organizacija prima potpore od raznih zaklada i organizacija. Dodatno, organizacija nudi određene plaćene usluge, poput masovnog digitaliziranja knjiga za knjižnice, čime dodatno podupire svoje neprofitne aktivnosti.

Sjedište se nalazi u San Franciscu, Kalifornija. Točnije, organizacija je smještena u bivšoj crkvi u Richmond Districtu, adaptirajući ovaj povijesni prostor za potrebe digitalnog doba. Internet Archive koristi vlastitu infrastrukturu za pohranu i upravljanje ogromnom količinom arhiviranih web stranica. Organizacija održava nekoliko podatkovnih centara, s glavnim centrom u San Franciscu i dodatnim sigurnosnim kopijama na drugim lokacijama.