Nu is er niets zo veranderlijk als een website (ten minste, als het goed is) die regelmatig wordt bijgewerkt. Over het algemeen is er een golfbeweging te herkennen van vernieuwing van websites. Eens in de 2 a 3 jaar zal een site gemiddeld een nieuw jasje krijgen. En dat betekent dat de oude versie, dan ergens staat waar niemand hem meer kan zien, in een backup op de server, of op een cd'tje bij de webmaster, of waar dan ook.
 
Maar ook online wordt een archief gemaakt. Al jaren is een van de oprichters van Alexa Internet, dat later werd overgenomen door Amazon, bezig een archief bij te houden van het internet. The internet Archive is in 1996 gestart met het vastleggen van websites. Door middel van het non-profit Internet Archive tracht Kahle zijn ideaal te realiseren van Universal Access to all Knowledge (universele toegang tot alle kennis). Internet Archive geldt inmiddels als een van de grootste collecties websites, films, audio, boeken en software.
Het archief onderhoudt de Wayback Machine, met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. Het archief wacht altijd zes maanden alvorens pagina's online te zetten.
 
De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië. Op dit moment telt het archief 150 miljard pagina's.
 
Een paar cijfers:
  • Hoeveelheid: 650 TeraBytes / rack
  • Power consumption: 6 KW / PetaByte
  • No Air Conditioning, instead use excess heat to help heat the building.
  • Raw Numbers as of December 2010:
    • 4 data centers, 1,300 nodes, 11,000 spinning disks
    • Wayback Machine: 2.4 PetaBytes
    • Books/Music/Video Collections: 1.7 PetaBytes
    • Total used storage: 5.8 PetaBytes
 
Je kunt waarschijnlijk dus nog wel een kopie van je oude website online vinden, en niet alleen via google cache, maar ook via archive.org.
 
In 2007 heeft archive zelfs in een keer 2 miljard pagina's vastgelegd, in een poging een snapshot van het internet te maken. Op dit moment (2014) al ruim 4,3 miljard pagina's.
 
Je kunt heel snel een pagina opzoeken: bijvoorbeeld met een eenvoudige link in je browser
 
 
Die link laat zien hoe nu.nl er in 2000 uitzag. Een van de weinige pagina's op het Nederlandse internet die herkenbaar blijft en niet veel verandert. Let wel, vaak zal hij geen plaatjes tonen, maar toch krijg je een aardig beeld van de periode.
 
Wil je snel weten hoe jouw site eruit zag in een bepaalde periode? Way-back machine heeft aardig wat pagina's, dus de kans is groot dat de jouwe er ook bij zit.

Deel hem dan!