Archive.org – naše digitalno pamćenje je ugroženo

Čuvar naše digitalne memorije, "Wayback Machine“, bori se za opstanak. Nakon hakerskih napada i tužbi za autorska prava, sada sve više medijskih kuća odbija da dozvoli da se njihovi sadržaji arhiviraju

509 pregleda 0 komentar(a)
Ilustracija, Foto: Shutterstock
Ilustracija, Foto: Shutterstock

Internet portal archive.org već 30 godina arhivira digitalne sadržaje. Wayback Machine obuhvata više od trilion pohranjenih veb-stranica i smatra se nezamjenljivim alatom za novinare, istraživače, istoričare i pravnike, koji žele pristup izbrisanim ili izmijenjenim sadržajima u njihovom izvornom obliku. Ali taj jedinstveni projekat neprofitne organizacije sa sjedištem u San Francisku suočava se s egzistencijalnom krizom – a najnovija prijetnja dolazi upravo od onih kojima je ta arhiva najhitnije potrebna: samih medija.

Sve veći broj velikih medijskih kuća tom internet arhivu uskraćuje pristup svojim sadržajima. Prema istraživanju Niman fondacije za novinarstvo sa Univerziteta Harvard, najmanje 241 novinski portal iz devet zemalja blokira veb-pretraživače arhive, uključujući Gardijan, Njujork tajms, Le Mond i najveći novinski koncern u SAD – Ju-Es-Ej Tudej Kompani.

Sami sebi uskraćuju pristup važnom alatu

Ju-Es-Ej Tudej je tako nedavno objavio senzacionalistički izvještaj o tome kako je američka Služba za imigraciju i carine (ICE) sistematski uskraćivala informacije o svojoj zatvorskoj politici. Osnova istraživanja bili su podaci Wayback Machine na archive.org. Ista medijska kuća koja je tu priču uspjela da napiše samo zahvaljujući tom arhivu, sada blokira pristup svojim sadržajima.

Ali, zbog čega medijske kuće sebi uskraćuju jedan od alata? Odgovor je jednostavan: strah od vještačke inteligencije (VI). Izdavači se boje da će kompanije koje se bave vještačkom inteligencijom, poput OpenAI ili Google, koristiti arhivu za masovni pristup njihovim novinarskim sadržajima, kako bi obučavale svoje jezičke modele – bez dozvole i bez nadoknade. Portparol Njujork tajmsa, Grejam Džejms, o toj temi se javno oglasio: "Problem je u tome što kompanije koje se bave vještačkom inteligencijom koriste naše sadržaje u internet arhivi kako bi nam direktno konkurisale – kršeći pritom autorska prava.“

Deset hiljada botova u sekundi

Podaci pokazuju da je ogroman broj botova bio usmjeren na veb-stranicu archive.org, tragajući za medijskim sadržajima za obuku VI-modela – čime su dobili pristup upravo onim podacima koji su im uskraćeni. Mark Grejem, direktor Wayback Machine, potvrdio je u razgovoru za magazin Wired da su pojedine kompanije povremeno pristupale arhivi sa desetinama hiljada zahtijeva u sekundi – do te mjere da su privremeno preopteretile servere.

Archive.org nije bio pripremljen za takvu situaciju, jer ta neprofitna organizacija podliježe pravilima otvorenog interneta. Njen moto je: „Baš kao i tradicionalna biblioteka, nudimo besplatan pristup istraživačima, istoričarima, naučnicima, osobama s teškoćama u čitanju i široj javnosti. Naš cilj je da obezbijedimo univerzalni pristup svim znanjima.“ To se takođe odnosi i na zabranu isključivanja botova i automatskih pretraživača (crawlera) – što je sada dovelo do sankcija koje su uvele velike izdavačke i medijske kuće.

Fondacija Electronic Frontier (EFF), organizacija za ljudska prava specijalizovana za digitalna pitanja, upoređuje postupke izdavača s tim da "izdavač novina najavljuje da bibliotekama više neće biti dozvoljeno čuvanje primjeraka njihovih izdanja“.

Istorija interneta mogla bi da bude izgubljena

U međuvremenu je više od 100 novinara potpisalo peticiju podrške internet arhivi. U njihovom otvorenom pismu se navodi: "U digitalnom medijskom pejzažu, gdje članci nestaju zbog gubitka linkova, spajanja kompanija ili mjera uštede troškova, novinari se često oslanjaju na arhivski Wayback Machine kako bi ponovo uspostavili stranice koje bi inače bile izgubljene. Bez tog kontinuiranog rada na očuvanju interneta, veliki djelovi nedavne novinarske istorije već bi bili izgubljeni.“

Mark Grejem je za magazin Wired pojasnio da je u pregovorima s medijskim kompanijama kako bi ponovo uspostavio pristup njihovim sadržajima. Još nije izvjesno kako će se ti pregovori završiti. No, njegov zaključak zvuči kao upozorenje: "Bez sumnje da sve veće blokiranje velikih djelova javnog veba narušava sposobnost društva da razumije ono što se događa u našem svijetu.“

"Veb-arhiviranje je dio javne infrastrukture“

Novinar i osnivač socialmedia watchblog.de, Martin Ferenzen, vidi archive.org kao jedini funkcionalni lanac dokaza za otvoreni veb. Ako on više ne može da izvršava svoje zadatke, to će imati značajne posljedice, rekao je on za DW: "Milioni citata koji su izvori Vikipedije izgubiće svoje uporište, odgovornost za istraživanje platforme – odnosno koji će se opšti uslovi i pravila kada primjenjivati, koja su pravila moderiranja preformulisana i kako – postaće mnogo teža, a pravno valjani digitalni dokazi će nestati.“ Blokiranje arhiva je, kako ističe, potpuno apsurdno, posebno za medijske kuće.

Da bi se riješio ovaj sukob, pojašnjava on, postoje dva načina: "Potreban nam je dijalog s izdavačima s jasnim tehničkim razdvajanjem arhiviranja i treninga za vještačku inteligenciju – jer je to u suštini dovelo do konflikta, a ne arhiva.“ U srednjoročnom periodu, Fehrenzen smatra da se za veb-arhive mora stvoriti poseban pravni status. A dugoročno gledano, "veb arhiviranje treba tretirati kao javnu infrastrukturu, a ne kao samostalni projekat nevladine organizacije u San Francisku. Činjenica da ona 2026. godine još uvijek zavisi od jedne organizacije predstavlja pravi strukturni neuspeh.“

Samo jedan od mnogih konflikata – ali najdramatičniji

Ovo nije prvi put da se internet-arhiva bori za svoj opstanak. U septembru 2024, tokom hakerskog napada, ukradeni su podaci sa 31 miliona korisničkih računa – težak udarac od koga se organizacija mukotrpno oporavila. Iste godine, arhiv je pred Američkim žalbenim sudom izgubio i spor oko autorskih prava *Hačet protiv internet arhive*: Izdavači Hačet, Pingvin Rendom haus, Harper Kolins i Vajli uspiješno su okončali tužbu protiv programa besplatnog pozajmljivanja elektronskih knjiga koji je arhiv pokrenuo tokom pandemije korone. Više od 500.000 knjiga moralo je biti uklonjeno iz servisa pozajmljivanja. Ipak, archive.org i dalje se suočava s milionima dolara odštetnih zahtijeva.

U poređenju s tim porazima, trenutna prijetnja koju predstavljaju medijske blokade je strukturno ozbiljnija – jer se ne može riješiti sudskom presudom ili ažuriranjem. To je rezultat brojnih korporativnih odluka koje, zajedno, potkopavaju osnovnu djelatnost Wayback Machine: sveobuhvatnu dokumentaciju javnog veba.

Pogledajte još: