Il Robots Exclusion Standard per Difendere i Diritti sui Tuoi Contenuti Online

Pubblicato il 25-03-2008 da Sergio

Bentornato nel Mio blog. Se trovi queste pagine interessanti abbonati gratuitamente tramite RSS feed o tramite Email!

In queste ore impazza per la blogosfera italiana una di quelle noiosissime polemiche che occupa spazio – sia come commenti sia come post – in quasi tutti i blog che frequento abitualmente.

Se hai capito di cosa parlo bene, altrimenti meglio: comunque questa volta non ho voglia di mettere link o citare fatti.

Sembra che il centro della questione questa volta siano alcuni “contenuti” raccolti da un sistema automatico (robot) e ripubblicati su alcune pagine contenenti pubblicità. Questo secondo gli autori dei “contenuti” sarebbe in violazione con le licenze attraverso i quali questi contenuti vengono distribuiti.

Internet è un sistema condiviso al quale hanno accesso milioni di utenti e per questa ragione nel corso degli anni si è sviluppato un insieme di regole e di standard per evitare conflitti e stabilire responsabilità: queste regole – pur non avendo nella maggior parte dei casi un valore legale – sono ampiamente condivise da chiunque voglia vivere la rete nel rispetto degli altri.

Anche per la situazione che ha generato le polemiche di questi giorni, naturalmente, esiste un regolamento al quale appellarsi: si chiama Robot Exclusion Standard.

Il Robot Exclusion Standard risale al 1994 ed è emerso come standard condiviso dalla robots mailing list.

Lo standard è semplice:
chi gestisce il sito mette nella directory root un file chiamato robot.txt nel quale andrà a specificare quali regole dovranno seguire i programmi automatici che accederanno alle pagine del suo sito.

Chi gestisce il programma automatico si impegnerà a far leggere e rispettare al programma quanto scritto dal gestore del sito nel suo robot.txt

In questo modo, ad esempio, potremmo negare la lettura ad ogni processo automatico escluso quello che indicizza le nostre pagine per conto di google con queste semplici righe:

User-agent: *
Disallow: /
User-agent:Googlebot
Disallow:

Lo standard non è molto lungo ed è scritto in modo semplice: quindi ti invito a leggerlo

Lo standard è comunque volontario, quindi non c’è alcuna garanzia che il robot legga e rispetti le nostre regole, ma comunque, nel caso potremo prendercela con chi gestisce il robot, e avremo anche ragione.

Internet ha delle regole fatte apposta per evitare polemiche, flame e ai litigi: basta conoscerle e rispettarle. Nel caso contrario se proprio vi divertite a litigare non è che potreste farlo privatamente via email o Instant Messanger?
Vero. Potrei anche non leggere le vostre polemiche: se solo sulla blogosfera italiana in questa Pasqua 2008 si parlasse d’altro…

Update
Ho scritto un nuovo post sulla stessa problematica più specifico rispetto alle licenze Creative Commons e la lettura automatica dei Feed RSS


Trackback | | Stampa

Lascia un commento