Conservazione Online a Breve Termine

Pubblicato il 05-08-2009 da Sergio Longoni

Ho scritto in precedenza della conservazione dei documenti in formato digitale per lunghi periodi: oggi invece proverò a scrivere qualche osservazione su quanto accade, con il passare dei mesi, a quello che viene pubblicato su internet.

Ho una lista molto lunga di post e articoli da leggere: questi articoli sono stati raccolti settimana dopo settimana a partire da settembre dello scorso anno.

Approfittando della relativa calma estiva nella quale molte delle fonti che consulto abitualmente hanno diminuito il numero di articoli pubblicati ogni settimana, ho deciso di cominciare ad accorciare la lista di lettura partendo dal fondo.

Nel corso di questa operazione mi sono reso conto di quanto quello che viene scritto ogni giorno su internet abbia problemi a conservarsi dopo meno di dodici mesi.

Andiamo nel dettaglio.

Nei casi peggiori non sono riuscito a trovare l’articolo che avevo linkato: questo succede per diverse ragioni.

Il sito non esiste più
In qualche caso alcuni blog sono stati chiusi o radicalmente cambiati e tutti gli articoli precedenti sono stati eliminati. In altri casi più semplicemente, i domini non sono stati rinnovati.

L’articolo non esiste più
Questo succede occasionalmente con i blog e più frequentemente con gli articoli dei siti di giornali e agenzie. In determinati casi l’archivio infatti non va oltre i sei mesi.

L’articolo è stato spostato
Può capitare che per una qualunque ragione l’amministratore del sito decida di modificare la struttura degli URL. Questo porta, nella maggior parte dei casi, ad invalidare tutti i link creati in una data precedente. Fortunatamente in alcuni casi se la pagina 404 è ben strutturata e facilita la ricerca del contenuto originale.

Ma anche una volta aperto l’articolo non è detto che tutto funzioni.

Contenuti multimediali mancanti
Capita con i video: per una ragione o per l’altra può capitare che i video nel corso del tempo vengano eliminati dai siti che li ospitano. Ad esempio in determinati casi i video vengono eliminati da youtube per ragioni di copyright o perché chi lo ha pubblicato ha deciso di non permettere più che il proprio video venga mostrato su siti terzi.
La stessa cosa può succedere con le immagini e con tutti gli altri contenuti collegati alla pagina.

Link errati
In molti casi capita che i link presenti negli articoli siano a loro volta errati o subiscano lo stesso tipo di problemi del contenuto originale.

Infine lo spam.

Spam nei commenti
I vecchi articoli, presumibilmente perché meno controllati, attirano un sacco di spam in più: in molti casi mi è capitato di trovare decine di commenti di spam sotto gli articoli. Se poi chi gestisce il blog ha preferito ordinare i commenti dal più recente al più vecchio allora diventa ancora più difficile andare a rintracciare i commenti buoni.

Articoli defacciati
Mi è persino capitato di trovare alcuni articoli nei quali era stato iniettato del contenuto spam tramite una operazione di sabotaggio. Penso che la ragione per cui questi articoli siano stati presi di mira rispetto a quelli più recenti è la stessa. L’amministratore del sito potrebbe non accorgersi di essere sotto attacco se, ad essere presi di mira sono esclusivamente alcuni articoli di archivio.

Quindi i nostri contenuti sono destinati all’oblio?
Si, se non ce ne prendiamo cura.

La manutenzione dell’archivio penso sia una delle sfide più interessanti per chi mantiene un sito o un blog particolarmente aggiornato. Io stesso mi sono ritrovato a modificare, in seguito alla segnalazione di un lettore che ringrazio, una serie di link interni al mio blog che, a causa di una modifica nella struttura degli url ritornavano un errore.

Penso che una soluzione a questo problema possa essere il creare una copia statica del contenuto al momento della pubblicazione. In questa copia statica dovrebbero anche, se possibile, essere visibili i contenuti linkati o inclusi come i video e le immagini.

Dopo qualche mese questa copia statica dovrebbe essere consolidata con i commenti e quindi sostituita al contenuto originale rispettando gli URL.

Non so se ci sono già gli strumenti in grado di fare una cosa del genere, ma potrebbe essere interessante, se non ci fossero, cercare di crearli.

E tu come fai a conservare quello che scrivi?


Trackback | | Stampa

Lascia un commento