The Internet Archive : la machine à remonter le web

Wayback Machine la mémoire du webInternet se développe à une vitesse galopante. The Internet Archive s’est donné pour mission d’être la mémoire du Web. L’organisme à but non lucratif a annoncé avoir indexé plus de 400 milliards de pages internet.

The Internet Archive garde une trace de tous les sites internet et autres contenus culturels numériques. La Wayback Machine permet de consulter toutes les pages mises en ligne depuis 1996, date de la création du programme. Il suffit de mettre une adresse url dans le moteur de recherche pour faire un voyage dans le passé et voir les évolutions d’un site. Les sites sont crawlés plusieurs fois par mois et cela devient vite amusant de voir comment c’était et comment c’est devenu.

Pour fêter ses 410 milliards de pages indexées, The Internet Archive retrace les étapes marquantes de sa machine à voyager dans le temps. The Wayback Machine est lancé en 2001. En 2006 le programme Archive-It est lancé pour les bibliothèques. Il leur permet de créer des collections de contenus web organisés.

En mars 2009 The Internet Archive et Sun Microsystems lancent un nouveau data center de 3 petabyte pour stocker les archives web. Le 28 Mai 2012, la Wayback Machine est de nouveau autorisée en Chine après plusieurs années d’interdiction.

Le 26 octobre 2012 la masse des données internet stockées depuis 2011 représentaient 80 terabytes. En octobre 2013, il est possible de demander la permission d’enregistrer une page archivée.

The Internet Archive pense que la Wayback Machine atteindra les 500 milliards de pages web indexées en 2015.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Retour en haut