Arhiva Internetului, noua Bibliotecă din Alexandria, nu lasă site-urile să dispară

Arhiva Internetului, noua Bibliotecă din Alexandria, nu lasă site-urile să dispară

Informaţiile sunt stocate în servere speciale FOTO wowowall.com

Într-o clădire de pe o stradă din San Francisco, câţiva oameni încearcă din răsputeri să demonstreze că informaţiile de pe Internet nu sunt efemere şi că WWW-ul are o memorie proprie.

Ştiri pe aceeaşi temă

Organizaţia „Internet Archive“ are sediul pe 300 Funston Avenue, în Richmond, San Francisco, potrivit „The Guardian“. Într-o clădire cu arhitectură neo-clasică înconjurată de statuete greceşti, în spatele unor uşi masive din metal, se află o mulţime de cutii care conţin unităţi de stocare capabile să înmagazineze câte 4 trilioane de bites fiecare. La subsolul acelei case, maşinăriile zornăie, aşezate în rânduri, iar sute de leduri clipesc, semn că informaţiile omenirii sunt stocate. Aceasta este Arhiva Internetului.

„Misiunea noastră este aceea de a oferi acces universal la informaţie, în orice moment. Suntem o parte a infrastructurii internetului. Suntem memoria web-ului“, susţine Rick Prelinger, preşedintele companiei.

„Internet Archive“ este o organizaţie non-profit, echivalentul digital al bibliotecii din Alexandra, un amalgam de site-uri web, clipuri video şi melodii care, în mod normal, s-ar fi pierdut. În momentul de faţă, Arhiva înmagazinează 281 de miliarde de site-uri şi, în fiecare lună, la acestea se mai adaugă alte miliarde. Serverele mai stochează şi cărţi, jurnale, clipuri Youtube şi ştiri. Toate aceste informaţii sunt disponibile gratuit pe site-ul archive.org.

„În timpul războiului din Irak, Casa Albă şi-a «retras» câteva comunicate de presă. Dar noi le aveam

Organizaţia a fost co-fondată în 1996 de către Brewster Kahle, un antreprenor, pionier în domeniul Internetului.

El a făcut o avere în anii ’90 mulţumită unor companii online, precum Alexa Internet, site-ul care analizează traficul de pe alte pagini Web.  Kahle s-a gândit la versiunea 2.0 a Bibliotecii din Alexandria în timp ce era student la Massachusetts Institute of Technology.

El consideră că misiunea „Internet Archive“ este foarte importantă. Presiunile economice, tehnologice şi politice devorează informaţiile digitale, la fel cum termitele devorau bibliotecile antice, scriu jurnlaiştii „The Guardian“. Mediile de stocare se deteriorează iar informaţiile se pierd. Afacerile dau faliment sau evoluează şi, în cadrul acestui, proces activitatea lor în mediul digital dispare aproape în totalitate. Guvernele şi instituţiile deseori şterg informaţiile incomode sau jenante iar în locul lor apar mesaje de genul „404 error“.

„În timpul războiului din Irak, Casa Albă şi-a «retras» câteva comunicate de presă. Dar noi le aveam“, susţine Prelinger. El este specializat în arhivarea filmulelor.  „Informaţiile digitale fac parte din patrimoniul nostru cultural dar sunt incredibil de volatile. Sunt fragile“, spune el. Stocarea lor nu este doar un act de conservare a istoriei ci şi o modalitate de a trage instituţiile la răspundere. „Vrem să menţinem Internetul un loc cinstit şi sigur şi să îl apărăm de ignoranţă“, a mai declarat Rick Prelinger.

„Internet Archive“ are şi o serie de aliaţi în această luptă împotriva efemerităţii. Printre aceştia se numără Wikipedia, Mozilla, Electronic Frontier Foundation dar şi răposatul Aaron Swartz. Google nu este una dintre companiile care susţin cauza aceasta.

„Este o muncă sisifică. Ştim că nu o să le salvăm niciodată pe toate. Web-ul, prin natura sa, este infinit

Echipa din spatele Arhivei Internetului a susţinut o petrecere, anul trecut, în octombrie, pentru a sărbători faptul că au reuşit să salveze 10 petabiţi de informaţii – echivalentul a aproximativ 10 miliarde de cărţi. Biblitecarii şi savanţii afirmă că oamenii care lucrează la Arhivă sunt „eroi“ şi „staruri rock“ însă membrii organizaţiei se consideră, mai degrabă, nişte tocilari, notează „The Guardian“.

Ei fac glume despre consumul de kilowatti şi despre replicarea meta-datelor. Unii sunt plătiţi în Bitcoini şi l-au convins şi pe patronul restaurantului chinezesc din apropiere să accepte această monedă ca formă de plată. În incintă există o mulţime de statui din teracotă care îi înfăţişează pe muncitorii care au la activ mai mult de trei ani în cadrul firmei. Organizaţia are şi un motor de căutare care permite explorarea a miliarde de pagini care datează din 1996, „The Wayback Machine“, denumit după un episod din desenul animat The Rocky and Bullwinkle Show.

În sediul de pe Funston Avenue lucrează aproximativ 50 de persoane. Alte 100 sunt în zona metropolitană şi în 32 de centre de scanare din întreaga lume. În aceste centre sunt digitalizate cărţi şi filme. S-a dovedit că procesele automate nu sunt deloc precise şi că este nevoie de implicarea directă a angajaţilor pentru a efectua această sarcină. Fiecare muncitor procesează între 800 şi 1000 de pagini pe oră. În posesia Arhivei se mai află şi 750.000 de cărţi, stocate într-un mediu cu climat controlat în care mai este spaţiu pentru alte 780.000.

Un alt departament, format din ingineri, se ocupă cu salvarea şi stocarea paginilor Web. Ei trebuie să reia fiecare site odată la trei luni. O pagină web rezistă, în medie, 75 de zile. În 2009 ei s-au străduit să salveze cât mai multe dintre site-urile făcute cu unealta GeoCities, închisă de Yahoo. Dacă proprietarul unui site defunct preferă ca acesta să rămână mort, poate solicita Arhivei să-l scoată din baza de date.

Inginerii colectează şi ştiri din mai mult de 60 de posturi TV din întreaga lume şi clipuri de pe Youtube. Filmuleţele de pe Youtube sunt culese în funcţie de recomandările făcute de oameni pe Twitter. „Nu este perfect, dar tweeturile ne arată ce este important în mintea oamenilor“, a declarat Alexis Rossi, directorul diviziei de colectare web. Ea estimează că cele 10 miliarde de adrese URL salvate la fiecare trei luni reprezintă aproximativ 10% din totalitatea Internetului, „Este o muncă sisifică. Ştim că nu o să le salvăm niciodată pe toate. Web-ul, prin natura sa, este infinit“, a spus ea.

În total, centrele „Internet Archive“ consumă 180 de kilowatti, cât aproximativ 45 de locuinţe.
 

citeste totul despre: