The Wayback Machine – Alles Wissen dieser Welt per Mausklick

In Kalifornien entsteht ein Wissensarchiv der ganz neuen Dimension. In einem Internetarchiv sollen alle je auf Datenträger gebannten Informationen für die Menschen abrufbar werden. Der amerikanische Computerspezialist Brewster Kahle möchte der Menschheit mit seiner gigantischen Internet-Bibliothek einen grossen Dienst erweisen und sich nebenbei noch seinen Lebenstraum erfüllen. Nach dem Vorbild der berühmten Bibliothek von Alexandria (im Jahre 288 vor Christus gegründet, beherbergte sie die bedeutendsten Schriften der damaligen Zeit) versucht er, das gesamte Wissen der Menschheit im Internet zu archivieren. Jeder Ton, jedes Bild und jedes Wort in der Geschichte der Menschheit soll ganz einfach für jedermann abrufbar werden.

Per Mausklick durch die Galaxie des Wissens
Heute reicht ein Mausklick um sich im Internet in wenigen Sekunden über die Weltgeschehnisse zu informieren. Auch im Internet-Archiv von Kahle gestaltet sich die Suche nach historischem Wissen denkbar einfach. Nachdem man zum Beispiel eine gewünschte Domain im Suchfeld des Internetarchivs eingegeben hat, kann es losgehen. Der „Take Me Back“-Button ist die Eintrittskarte für eine Reise durch die Vergangenheit dieser Domain. In einer zeitlich geordneten Liste erscheinen sämtliche Website-Kopien seit 1996. Auf mehr als 500 Millionen gespeicherten Seiten, von Google bis Spiegel Online, werden so beispielsweise die Terroranschläge des 11. September thematisiert. Hinter diesem virtuellen Weltgedächtnis steckt die von Kahle erschaffene Wayback-Machine, eine Art Zeitmaschine zum Archivieren von Websites, bevor sie irgendwann im Netz verschwinden. Alle zwei Monate macht diese eine Momentaufnahme des Netzes und dies nun seit mittlerweile zwölf Jahren. Die virtuellen Schnappschüsse werden dann auf zahlreichen Grossrechnern mit einer Speicherkapazität von jeweils mehr als 300 Gigabyte gelagert. Das Projekt startete mit 30 Millionen Websites. Heute warten vier Milliarden Sites im Internetarchiv auf interessierte Leser. Das Volumen des Archivs beträgt derzeit drei Petabyte. Seit 2000 sammelt Brewster Kahle zusätzlich Filme, Texte und Bilder. Über 150’000 User stöbern jeden Tag in den archivierten Webseiten, Bildern, Texten und Audiodateien.

Ein Projekt mit Grenzen?
Die grösste Sorge von Kahle ist, dass er schon bald an die Grenzen der Speicherkapazitäten stossen wird. Wohl berechtigt, denn nur schon die durch das Hochladen von Videos entstehenden Datenmengen gefährden das Projekt Internetarchiv. Das Internet als Bibliothek – eine wunderbare Idee! Aber ist es überhaupt möglich das komplette Angebot aller je publizierten Werke zu erfassen? Wie seht Ihr die Zukunft dieses Wissensarchivs?

Weiterempfehlen

image description

Kommentieren

7 Kommentare

image description
  1. Hampi | 8.12.2010 09:31

    Gibt es heute eine Alternative zu Wayback Machine http://waybackmachine.org/ ?

  2. Alessandra | 6.08.2008 13:46

    Das Internet ist ein sehr schnelllebiges Medium. Das ständige Verschieben, Verändern oder Löschen von Informationen auf Websites macht das Erfassen einzelner Publikationen sehr schwierig. Nicht nur deshalb finde ich die Möglichkeiten, welche dieser Service bietet, überwältigend. Das Internet ist schon heute eines der umfangreichsten Nachschlagewerke der Welt. Ursprünglich wurde die Wayback Machine als Recherche-Werkzeug für Wissenschaftler, Studenten und Journalisten entwickelt. Heute ist sie eine digitale Bibliothek für jedermann und gehört zu den wichtigsten Werkzeugen, um die Historie einer Website festzuhalten. Ein übersichtliches Layout, diverse Suchfunktionen, jede Menge Video- und Audioeinspielungen – ich persönlich verweile gerne auf der Seite.

    Unter: http://web.archive.org/collections/pioneers.html findet sich übrigens eine kleine Auswahl der ersten Seiten des Internets.

    Problematisch an der Wayback Machine ist, dass auch Inhalte erhalten bleiben, welche die Autoren eigentlich nicht mehr vertreten. So ist beinahe alles, was jemals online gestellt wurde für die Öffentlichkeit nachprüfbar. Bestimmt wird nicht jede Archivierung demnach dem Willen des Seitenbetreibers entsprechen. Da jedoch kein Interesse besteht Websites und Dokumente von Personen oder Organisationen aufzunehmen, die dies nicht wünschen, kann dies mittels einer robots.txt-Datei, welche im Hauptverzeichnis auf dem Webserver abgelegt wird, verhindert werden. Auch bereits aufgenommenen Websites können so wieder entfernt werden.

  3. John | 4.08.2008 13:33

    Ist doch eine gute Sache, wenn sich jemand die Mühe macht das Internet zu archivieren. Vielleicht sind die Daten irgendwann von Nutzen.

    Die Datenmengen sind schon beeindruckend. Von Petabyte habe ich noch nichts gehört. Für mich war Terabyte das höchste aller Gefühl.

  4. urs | 4.08.2008 11:30

    @hugo: Die Verfügbarkeit der „alten“ Websites ist wirklich das grösste Problem. Trotzdem gibt es die Entwicklung recht gut wieder. Mit Themen wende ich mich halt klassisch an google oder Wikipedia.
    @Elisabetta: Übrigens nach Petabyte kommen : Exabyte, Zettabyte und 10 Hoch 24 ist dann 1 Yottabyte. Die Nomenklatur sollte die nächsten 2 Jahre nicht das Problem sein ;-D

  5. René | 4.08.2008 10:12

    Ich nütze den Dienst vor allem um die Geschichte von einer Webseite zu erforschen. Doch da hat es oft Lücken oder Fehler drin. Auch hier gilt wie bei allen anderen Datensammlungen, es kommt auf die Qualität an und nicht die Quantität.

  6. Hugo | 3.08.2008 15:44

    Die Site ist ja schon ziemlich alt und ich konnte bisher selten schlaue Suchresultate erzielen.
    Meisten sind die Websites nach denen ich suche nicht mehr vorhanden oder der Ladevorgang geht ewig.
    Bei der Suche nach Events kommen zu viele Resultate die nicht einer wirklichen Ordnung unterstellt sind. Dh wenn ich nicht gleich sehe was ich suche, bin ich wieder weg, Beispiel „football world cup 2006“.
    Interessant wäre es natürlich schon aber irgendwie kam die Website nie richtig ins Rollen.

  7. Elisabetta | 2.08.2008 18:41

    Eigentlich eine super Idee. Habe soeben schnell etwas gesucht auf der benannten Seite. Aber bin leider enttäuscht worden 🙂 macht nichts! Petabyte?? Wusste gar nicht dass es diese Bezeichnung gibt 😉 Ich schätze mal irgendwann ist wirklich „dead end“ mit der Datenspeicherung (reines Bauchgefühl)….Hat schon jemand versucht ein geschichtliches Geschehen dass nicht so für Aufregung gesorgt hat (wie 9-11) zu suchen? Falls ja, erfolgreich?

Kommentar schreiben

Please copy the string BhrS5j to the field below: