Je suis Charlie

Autres trucs

Accueil

Seulement les RFC

Seulement les fiches de lecture

Mon livre « Cyberstructure »

Ève

Que sont les dinosaures devenus ?

Première rédaction de cet article le 25 novembre 2008


Sur mon site Web se trouvaient il y a très longtemps des jolies photos de dinosaures numérisées à partir d'un vieux livre. N'étant pas sûr de la situation légale de ces photos, j'ai préféré les retirer.

Ce qui est curieux, c'est que les adresses Web ne meurent jamais. Des années après, ces photos, qui étaient très populaires et bien référencées (et on parle d'une époque où Google n'existait pas) continuent à être demandées à leur ancienne adresse, http://www.internatif.org/bortzmeyer/dinos/. La leçon à en tirer est qu'il ne faut pas changer les adresses des ressources Web : on ne peut pas changer les milliers d'endroits où elles sont enregistrées.

Le moteur de recherche de Yahoo, par exemple, s'obstine à demander ces images. Il n'a jamais accepté qu'elles disparaissent :

72.30.87.98 - - [25/Nov/2008:09:26:47 +0100] "GET /dinos/index.fr.html HTTP/1.0" 410 457 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" www.bortzmeyer.org

J'ai modifié la configuration d'Apache pour renvoyer le code d'erreur 410 (« Parti définitivement » alors que la classique 404 peut être temporaire ; les deux codes sont décrits respectivement dans les sections 6.5.9 et 6.5.4 du RFC 7231). Dans le .htaccess :

Redirect gone /dinos

Apache envoie alors un message d'erreur sans ambiguïté. Mais cela n'a rien changé, Yahoo continue à s'acharner.

Parfois, l'examen du champ Referer: tel qu'il est enregistré dans le journal d'Apache indique que le visiteur vient d'une page de liens comme http://www.lauriefowler.com/dinopix.html, page qui n'est plus mise à jour depuis longtemps. Le Web est d'une stabilité étonnante...

Au cas où cette inertie ne suffise pas, vous pouvez aussi utiliser le remarquable service de Internet Archive pour voir une version archivée de ces photos.

Version PDF de cette page (mais vous pouvez aussi imprimer depuis votre navigateur, il y a une feuille de style prévue pour cela)

Source XML de cette page (cette page est distribuée sous les termes de la licence GFDL)