Benvenuto in O.S.R! - Open Source Revenge!
Questo blog è nato il 23 Febbraio 2007.
Se vuoi contribuire (scrivere articoli o altro) guarda come fare qua:
http://nuxil.blogspot.com/2007/02/collaborare.html
Torna alla Home

domenica 4 marzo 2007

Internet Archive

Accesso universale a tutto il sapere umano: la premessa è affascinante. Il risultato è il colossale sito web di Internet Archive (archive.org), al cui interno sono memorizzati milioni di documenti, video, brani musicali e programmi "open", messi a disposizione dalla comunità di internauti. In parole povere, è uno dei più interessanti e riusciti esperimenti del web, quasi paragonabile a wikipedia. L'unico problema riguarda il fatto che il sito è solo in inglese...

LE ORIGINI
Il progetto nasce nel 1996, e si amplia assorbendo altri archivi precedenti. Nell'arco di 10 anni, internet archive ha raccolto,catalogato e messo a disposizione dell'utente migliaia di file. Il sito è suddiviso in sezioni tematiche, contenenti i database relativi ad ogni singola collezione. Nelle pagine di Internet Archive si trova di tutto, dai film ai corsi didattici messi a disposizione da delle università Canadesi e statiunitensi. La libreria è in continua espansione gli estimatori del progetto, infatti, collaborano attivamente per reperire nuovi materiali e reclutare nuovi volontari per accrescere il database.

LA MACCHINA DEL TEMPO
Una delle sezioni più interessanti di Internet Archive è la Way Back Machine, un gigantesco archivio che memorizza le pagine WEB pubblicate negli ultimi 10 anni. Sebbene permetta di dare un'occhiata al passato della rete, questo monumentale backup non è un semplice passatempo. L'obbiettivo principale che anima il progetto è quello di evitare la perdita di tutte le informazioni pubblicate sul web negli ultimi 10 anni. Grazie alla Way Back Machine possiamo infatti recuperare velocemente le prime pagine dei giornali online riguardanti un determinato evento che ci interessa, o rintracciare un documento introvabile. La raccolta di siti nella Way Back Machine è affidata a un software chiamato crawler, che analizza le pagine web registrandole automaticamente. La raccolta è poi integrata dai tanti appassionati (come me) che usano Alexa Toolbar, basta infatti premere il pulsante "Way Back Machine". Inoltre è anche possibile escludere delle pagine non adatte (come siti pornografici...)


IL BACKUP
Il compito di conservare il materiale di questa immensa libreria richiede mezzi adeguati, con la preoccupazione principale che riguarda il rischio di deterioramento dei supporti su cui sono memorizzati i file. I tecnici di Internet Archive, oltre a sfruttare i tradizionali dischi fissi (vedi sotto), utilizzano anche supporti di backup come dischi magneto-ottici e nastri DLT. Inoltre le copie di backup vengono conservate in luoghi differenti per prevenire disastri "imprevedibili" come incendi o alluvioni.

LO STORAGE
Per memorizzare l'impressionante mole di file che compongono l'archivio, vengono utilizzate due Petabox (immagine a destra), due NAS (Network Attached Storage) da un PetaByte (10000024 GB). Per il momento di queste macchine ne esistono due, dislocate a San Fransisco e Amsterdam pieni "solamente" di 180.000 GB.

4 commenti:

Anonimo ha detto...

bellissimo quello che lo ha fatto è un figo

NuxiL ha detto...

Ma piantala Ampo asD

Mariu Revolution ha detto...

magari nn è Ampo... conoscendolo xò...

NuxiL ha detto...

Sì che è lui, me l'ha detto..