Automatisch alle besuchten Websites in der Wayback Machine speichern

Ich habe ein Tampermonkey Script geschrieben, welches automatisch jede besuchte Website in die Wayback Machine speichert. Wenn die jeweilige Seite in den letzten 30 Tagen bereits archiviert wurde, wird die Archivierung übersprungen. Wir wollen ja nicht die Wayback Machine mit sinnlosen Archivierungen zuspammen.

Das Script

Was gibt es zu beachten?

  1. Die Privatsphäre könnte beeinträchtigt werden, falls in einer URL etwas kritisches steht. Wenn zum Beispiel in einer URL deine E-Mail-Adresse steht, wird sie in der Wayback Machine landen (Bei der Auflistung aller archivierten Seiten für eine Domain). Jedoch ist das kein so großes Problem weil sensitive Informationen möglichst nicht in der URL stehen sollten (Auf manchen Websites passiert es leider trotzdem).
  2. Privater Websiteinhalt wird in aller Regel nicht archiviert. Wenn du z.B. deine Amazon Bestellungen ansiehst, werden diese nicht in der Wayback Machine landen weil die Wayback Machine keinen Zugriff auf die Seite hat (Nur du hast die Anmeldecookies).
  3. In der rechten unteren Ecke wird immer ein kleines farbiges Badge erscheinen (Außer man hat im Quellcode die Option SHOW_BADGES auf false gestellt). Man kann mit der Maus drüberfahren, um mehr Informationen zu erhalten. Grün = Archiviert. Orange = Archivierung nicht nötig. Rot = Archivierung fehlgeschlagen. Man sollte aber beachten dass diese Rückmeldung nicht wirklich zuverlässig ist. Es kann gut sein dass die Archivierung geklappt hat obwohl ein Fehler gemeldet wurde. Außerdem kann es je nach Auslastung der Systeme des Internet Archives lange dauern bis ein Archivierungserfolg gemeldet wird.
  4. Es sind einige exclude-Flags vorkonfiguiert. Diese verhindern die Skriptausführung auf manchen Seiten. Die Flag // @exclude *google.*/search* sorgt zum Beispiel dafür, dass Google-Suchergebnisseiten nicht archiviert werden (Weil ich der Meinung bin dass das kein archivierungswürdiger Content ist). Fühle dich frei die exclude-Flags zu bearbeiten.