English
MM3 MM3-WebAssistant

Update Cache-Archiv

Mit diesem MM3-WebAssistant - Proxy Offline BrowserMM3-Utility können Sie die Seiten eines Cache-Archiv aktualisieren. Ausgehend von einer oder mehreren Startseiten werden die Links zu bereits archivierten Seiten verfolgt und veränderte Seiten in einem Update-Archiv gespeichert.

top

Start des MM3-WebAssistant - Proxy Offline BrowserMM3-Utility

Sie starten die Aktualisierung mit einer der folgenden Skript-Dateien im Ordner: MM3-WebAssistantProfessional/script/
SkriptBetriebssystem
MM3-Utility.batWindows von Microsoft
MM3-Utility.shLinux und UNIX
MM3-Utility.commandMac OS X von Apple
Im ersten Dialog werden alle Utilities angezeigt. MM3-Update starten Wählen Sie aus: Aktualisieren von archivierten Seiten.
Mit Weiter kommen Sie zu dem Konfigurationsdialog MM3-WebAssistant - Proxy Offline BrowserMM3-Update. MM3-Update Konfiguration Eine Update-Konfiguration können Sie in einem Set speichern. Benutzen Sie zunächst das Set default. Mit Neu legen Sie ein neues Set an. Weiterhin können Sie über ein Kontext-Menü (Pop up) ein Set Umbenennen oder Löschen.
top

Allgemein

Startseite

Ausgehend von einer oder mehreren Startseiten werden die Links zu bereits archivierten Seiten verfolgt. Veränderte Seiten werden in einem Update-Archiv gespeichert. Für jede Startseite geben Sie die URL in einer neuen Zeile an.

Hinweis

Einschränkungen bestehen bei der Linkverfolgung von dynamischen Elementen, wie Java-Skript und Flash.

Surf-Set und Cache-Archiv

Es werden die Parameter des Surf-Sets verwendet, mit Ausnahme von Marker und Prefetch. Es wird nur das Cache-Archiv aktualisiert, welches das Schreibrecht im ausgewählten Surf-Set besitzt. Die Aktualisierung erfolgt über die Verfolgung von Links der Seiten des Cache-Archivs. Enthält das Surf-Set nur ein Cache-Archiv, so werden die Links verfolgt, die grün markiert sind (siehe Surf-Set/Marker).

Update-Archiv

In diesem Archiv werden die aktualisierten Seiten und deren neuen Ressourcen archiviert. Der Name des Update-Archivs entspricht dem Namen des zu aktualisierenden Cache-Archivs mit einem Namenszusatz. Als Zusatz wird standardmäßig das Tagesdatum verwendet, dieses wird durch ein Zeichenmuster angegeben. Das Zeichenmuster beginnt mit der öffnenden Klammer [ und endet mit der schließenden Klammer ].
Es bedeuten:
ZeichenBeschreibungBeispiel
yyzweistellige Zahl für das Jahr06
MMzweistellige Zahl für den Monat03
ddzweistellige Zahl für den Tag21
HHzweistellige Zahl für die Stunden14
mmzweistellige Zahl für die Minuten36
wwzweistellige Zahl für die Kalenderwoche40

Vor der Archivierung können Sie den Umfang der zu aktualisierenden Seiten überprüfen. Hierzu deaktivieren Sie das Update-Archiv. Mit diesem Ergebnis können Sie weitere notwendige Startseiten bestimmen oder zur Einschränkung der Linkverfolgung angeben.

Hinweis

Seiten werden nur archiviert, falls das Update-Archiv aktiviert ist.

Wiederverwendung

Update aktualisiert alle Dateien, die älter sind als die eingestellte Zeit der Wiederverwendung.

Die Wiederverwendung können Sie als relative oder absolute Zeit angeben.
Beispiele sind in den beiden folgenden Tabellen angegeben.

Relative Zeitangabe:
EinheitBeschreibungBeispiel
mMinuten62m
hStuden10h
dTage3d
wWochen2w
MMonate6M
yJahre1y
Absolute Zeitangabe:
FormatBeschreibungBeispiel
yyyy.MM.ddDatumsangabe Jahr.Monat.Tag2008.08.19
hh:mmZeitangabe Stunde:Minute10:30
yyyy.MM.dd hh:mmDatumsangabe und Zeitangabe2008.08.19 10:30

Hinweis

Geben Sie die Datums- bzw. Zeitangabe nicht vollständig vor, wird das aktuelle Tagesdatum und die Tageszeit benutzt.
Unvollständige Angaben werden wie folgt ergänzt:
FormatBeschreibung
..1 00:00erster Tag des aktuellen Monats

Wartezeit

Manche Server brechen ein automatisches Laden von Seiten ab, da hierbei die Seiten in viel schnellerer Folge abgerufen werden als dies beim Surfen erfolgt. Fügen Sie deshalb eine Wartezeit ein, am Besten lassen Sie diese zwischen einer minimalen und maximalen Wartezeit variieren.

Protokoll

Alle verfolgten Links werden standardmäßig protokolliert.

Zusätzlich können Sie folgende URLs protokollieren:
Protokoll mitIn einer HTML-Seite ...
Enthaltene Ressourcenalle enthaltenen Ressourcen
Nicht verfolgte Linksalle nicht verfolgten Links

In der Zusammenfassung können zusätzlich nicht verfolgte Links protokolliert werden.

Hinweis

Mehrfach vorkommende Seiten und Ressourcen werden nur einmal protokolliert.
top

Linkverfolgung

Werden bei einem Update für Sie nicht interessante Seiten geladen, so können Sie dies mit einem Filter verhindern. In dem Filter können Sie definieren: Domain, Pfad, Dateiname, Datei- oder MIME-Typen. Zusätzlichen können Sie den Parameter Folgen angeben, welcher die Wirkung des Filters steuert.
Es bedeutet:
FolgenLink verfolgen oder ausschließen
JaVerfolgen: Falls der Link das Zeichenmuster des Filters enthält.
NeinAusschließen: Falls der Link das Zeichenmuster des Filters enthält.
---Deaktiviert: Filter wird nicht benutzt.

Falls beides, Verfolgen und Ausschließen, auf einen Link zu trifft, dann wird der Link ausgeschlossen und die Seite nicht geladen.

Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für die Linkverfolgung

Beispiel:
FolgenDomainPfadDateiTyp
Ja*.Proxy-Offline-Browser.de/*/**
Nein*.Proxy-Offline-Browser.de/*/*pdf application/pdf
Nein*.Proxy-Offline-Browser.de/private/*/**

Es werden nur Seiten aus der Domain Proxy-Offline-Browser.de geladen, jedoch keine PDF-Dokumente und Seiten aus dem Verzeichnis /private/ und dessen Unterverzeichnisse.

Hinweis

Bei Links für die kein Filter angegeben ist, können Sie auswählen, ob generell der Link zu verfolgen, ausschließen oder nachzufragen ist.
Bei Nachfragen können Sie interaktiv beim Update angegeben, ob ein Link zu verfolgen oder auszuschließen ist.

Mit Filter generieren können Sie die benötigten Filter aus den Startseiten generieren. Ein zusätzliches Muster kann die Filter noch anpassen.

Protokoll

Alle lokal vorhandene Seiten protokollieren, die durch die Linkverfolgung ausgeschlossen werden. Hiermit können Sie die Einstellung des Filters überprüfen.
top

Cookie

Cookies können je nach Filtereinstellung angenommen oder blockiert werden. Neben dem Datenschutz können Sie hiermit z.B. die Darstellung eines Navigationsverlaufs (Krümelpfad) auf einer HTML-Seite verhindern.
Es bedeutet:
AnnehmenCookie annehmen oder blockieren
JaAnnehmen: Falls die URL das Zeichenmuster des Filters enthält.
NeinBlockieren: Falls die URL das Zeichenmuster des Filters enthält.
---Deaktiviert: Filter wird nicht benutzt.

Falls beides, Annehmen und Blockieren, auf ein Cookie zu trifft, dann wird das Cookie blockiert.

Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für Cookie

Beispiel:
AnnehmenDomainPfad
Nein*.*.*/*/

Es werden keine Cookies angenommen.

Protokoll

Alle angenommenen Cookies werden protokolliert. Hiermit können Sie die Einstellung des Filters überprüfen.
top

Authentifizierung

Für eine passwortgeschützte Web-Site kann der Benutzername und das Passwort gespeichert werden.

Es bedeutet:
LoginZugangsdaten für Web-Site
JaEinloggen: Für diese URL mit den Zugangsdaten einloggen.
NeinBlockieren: Für diese URL nicht mehr einloggen.
---Deaktiviert: Filter wird nicht benutzt.

Zusätzlich können Sie angeben, ob beim Aufruf einer geschützten Seite das Passwort gespeichert werden soll.

Passwörter können über ein Master-Passwort geschützt werden. Das Master-Passwort ist bei jedem Start des Utility MM3-WebAssistant - Proxy Offline BrowserMM3-Update einzugeben.

Hinweis

Es können nur Anmeldungen bei Web-Sites verarbeitet werden, bei denen die Anmeldung durch den Header des HTTP-Protokolls angefordert wird (Anmeldung über Dialogbox des Browsers). Anmeldungen über ein HTML-Formular werden nicht unterstützt.
top

Start der Aktualisierung

Nachdem Sie die benötigte Konfiguration ausgefüllt bzw. ein Set ausgewählt haben starten Sie die Aktualisierung mit Update starten. Der Verlauf der Aktualisierung wird in einem Dialog protokolliert. Beim Ende der Aktualisierung oder beim Abbruch wird eine Zusammenfassung ausgegeben.

Über alle geänderten HTML-Seiten wird ein Report (Update-Archiv) erstellt.

top

Anzeigen der Reports Update-Archiv

Von der lokalen Sitemap gelangen Sie zu den Reports (bzw. mit der URL: http://127.0.0.1:8080/update/). Den gewünschten Report wählen Sie aus einer Liste aus. Ein Report enthält alle veränderten Seiten einer Aktualisierung. Neu hinzugekommene Textstellen in einer Seite werden angezeigt. Den Umfang der Anzeige können Sie einstellen:
  • Anzahl der veränderten Seiten pro Reportseite
  • Anzahl der Zeichen, die bei einer veränderten Textstelle angezeigt werden sollen
  • Sortierfolge der veränderten Seiten

In einem Report können Sie surfen. Die Veränderungen werden Ihnen beim Surfen angezeigt (Default blau markiert). Beim online Surfen werden alle zu archivierenden Seiten im Update-Archiv gespeichert (nicht im Cache-Archiv).

Diesen Modus erkennen Sie dadurch, dass beim Surfen im Report das Update-Symbol anstelle des Surf-Set-Symbols angezeigt wird. Klicken Sie auf das Update-Symbol , so wird der Update-Modus beendet. In den Update-Modus gelangen Sie beim Aufruf eines Reports. Der aufgerufene Report bestimmt das Update-Archiv und das Surf-Set. Werden mehrere Reports gleichzeitig angezeigt, bestimmt der zuletzt aufgerufene (geladene) Report das Update-Archiv und das Surf-Set. Im Hauptmenü wird das benutzte Surf-Set angezeigt und der Tool-Tipp gibt das Update-Archiv an.

top

Übernehmen

Mit einem Klick auf das Synchronisierungs-Symbol werden alle Ressourcen in das entsprechende Cache-Archiv kopiert. Die kopierten Domains werden protokolliert. Danach können Sie den Report und/oder das Update-Archiv löschen.
<- Spiegeln Konvertieren bzw. zusammenfügen von Cache-Archiven ->
© MM3Tools, 7. November 2016 mail WebAssistant@MM3Tools.deRechtliche Hinweise