|
Mit diesem Utility
können Sie verlinkte Seiten automatisch laden und speichern. Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt und im Cache-Archiv
gespeichert.
Start des Utility
Sie starten die Spiegelung im Hauptmenü mit dem Symbol 
und erhalten den Konfigurationsdialog Mirror.
Alternativ können Sie die Spiegelung auch starten mit dem Skript MM3-Utility im Ordner MM3-WebAssistantProfessional/script/.
Eine Mirror-Konfiguration können Sie in einem Set speichern. Benutzen Sie zunächst das Set default. Mit Neu
legen Sie ein neues Set an. Weiterhin können Sie über ein Kontext-Menü (Pop up) ein Set Umbenennen oder Löschen.
Allgemein
Startseite
Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt, Seiten geladen und im Cache-Archiv gespeichert. Für jede Startseite geben
Sie die URL in einer neuen Zeile an.
Hinweis
Einschränkungen bestehen bei der Linkverfolgung von dynamischen Elementen, wie Java-Skript und Flash.
Sequenz
Geben Sie mehrere Startseiten an, so werden diese zunächst geladen (Tiefe 1).
Danach werden alle Links der Startseiten geladen (Tiefe 2), und so weiter.
Alternativ können die Startseiten auch sequentiell geladen werden.
Surf-Set
Es werden die Parameter des Surf-Sets verwendet, mit Ausnahme von Marker und Prefetch. Ein wichtiger Parameter ist die Wiederverwendungszeit
von Dateien im Cache-Archiv. Innerhalb ihrer Wiederverwendungszeit werden Dateien nicht neu aus dem Internet geladen.
Abbruch
Oft ist vorab nicht absehbar, wie viele HTML-Seiten tatsächlich verfolgt und geladen werden. Verwenden Sie deshalb Abbruchkriteriern, um die automatische
Linkververfolgung zu begrenzen. Die Linkverfolgung wird abgebrochen, wenn ein Abbruchkriterium erreicht ist. Zusätzlich können Sie einen Filter
benutzen.
Folgende Abbruchkriterien können Sie angeben:
- Tiefe
Linktiefe der zu verfolgenden Link.
- HTML-Seiten
Anzahl der maximal zu ladenen HTML-Seiten.
- Volumen
Größe des maximal zu ladenden Datenvolumens.
- Zeit
Maximale Zeit für die Dauer der Linkverfolgung in Minuten.
Wartezeit
Manche Server brechen ein automatisches Laden von Seiten ab, da hierbei die Seiten in viel schnellerer Folge abgerufen werden als dies beim Surfen
erfolgt. Fügen Sie deshalb eine Wartezeit ein, am Besten lassen Sie diese zwischen einer minimalen und maximalen Wartezeit variieren.
Report
Ein Report der verfolgten Links kann erstellt werden. Sie können wählen, zwischen einem Report mit allen Links oder nur mit den Links, bei denen auch
ein Download erfolgte.
Protokoll
Alle verfolgten Links werden standardmäßig protokolliert.
Zusätzlich können Sie folgende URLs protokollieren:
| Protokoll mit | In einer HTML-Seite ... |
| Enthaltene Ressourcen | alle enthaltenen Ressourcen |
| Nicht verfolgte Links | alle nicht verfolgten Links |
|---|
In der Zusammenfassung können zusätzlich nicht verfolgte Links protokolliert werden.
Hinweis
Mehrfach vorkommende Seiten und Ressourcen werden nur einmal protokolliert.
Linkverfolgung
Werden bei einer Spiegelung für Sie nicht interessante Seiten geladen, so können Sie dies mit einem Filter verhindern. In dem Filter können Sie definieren:
Domain, Pfad, Dateiname, Datei- oder MIME-Typen. Zusätzlichen können Sie den Parameter Folgen angeben, welcher die Wirkung des Filters
steuert.
Es bedeutet:
| Folgen | Link verfolgen oder ausschließen |
| Ja | Verfolgen: Falls der Link das Zeichenmuster des Filters enthält. |
| Nein | Ausschließen: Falls der Link das Zeichenmuster des Filters enthält. |
| --- | Deaktiviert: Filter wird nicht benutzt. |
|---|
Falls beides, Verfolgen und Ausschließen, auf einen Link zu trifft, dann wird der Link ausgeschlossen und die Seite
nicht geladen.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für die Linkverfolgung
Beispiel:
| Folgen | Domain | Pfad | Datei | Typ |
| Ja | *.Proxy-Offline-Browser.de | /*/ | * | * |
| Nein | *.Proxy-Offline-Browser.de | /*/ | * | pdf
application/pdf |
| Nein | *.Proxy-Offline-Browser.de | /private/*/ | * | * |
|---|
Es werden nur Seiten aus der Domain Proxy-Offline-Browser.de geladen, jedoch keine PDF-Dokumente und Seiten aus dem Verzeichnis /private/ und dessen
Unterverzeichnisse.
Hinweis
Bei Links für die kein Filter angegeben ist, können Sie auswählen, ob generell der Link zu verfolgen, ausschließen
oder nachzufragen ist.
Bei Nachfragen können Sie interaktiv beim Spiegeln angegeben, ob ein Link zu verfolgen oder auszuschließen ist.
Mit Filter generieren können Sie die benötigten Filter aus den Startseiten generieren. Ein zusätzliches Muster kann die Filter noch
anpassen.
Möchten Sie in einer Seite z.B. Bilder ausschließen, müssen Sie hierfür den Filter für Werbung benutzen.
Protokoll
Alle Seiten protokollieren, die von der Linkverfolgung ausgeschlossen werden. Hiermit können Sie die Einstellung des Filters überprüfen.
Cookie
Cookies können je nach Filtereinstellung angenommen oder blockiert werden. Neben dem Datenschutz können Sie hiermit z.B. die Darstellung eines Navigationsverlaufs
(Krümelpfad) auf einer HTML-Seite verhindern.
Es bedeutet:
| Annehmen | Cookie annehmen oder blockieren |
| Ja | Annehmen: Falls die URL das Zeichenmuster des Filters enthält. |
| Nein | Blockieren: Falls die URL das Zeichenmuster des Filters enthält. |
| --- | Deaktiviert: Filter wird nicht benutzt. |
|---|
Falls beides, Annehmen und Blockieren, auf ein Cookie zu trifft, dann wird das Cookie blockiert.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für Cookie
Beispiel:
| Annehmen | Domain | Pfad |
| Nein | *.*.* | /*/ |
|---|
Es werden keine Cookies angenommen.
Protokoll
Alle angenommenen Cookies werden protokolliert. Hiermit können Sie die Einstellung des Filters überprüfen.
Authentifizierung
Für eine passwortgeschützte Web-Site kann der Benutzername und das Passwort gespeichert werden. Je nach Web-Site erfolgt die Anmeldung über zwei unterschiedliche
Verfahren.
Anforderung durch den HTTP-Header
Erfolgt die Anmeldung durch den Header des HTTP-Protokolls, so können Sie Benutzername und Passwort hier angeben.
Es bedeutet:
| Login | Zugangsdaten für Web-Site |
| Ja | Einloggen: Für diese URL mit den Zugangsdaten einloggen. |
| Nein | Blockieren: Für diese URL nicht mehr einloggen. |
| --- | Deaktiviert: Filter wird nicht benutzt. |
|---|
Zusätzlich können Sie angeben, ob beim Aufruf einer geschützten Seite das Passwort gespeichert werden soll.
Passwörter können über ein Master-Passwort geschützt werden. Das Master-Passwort ist bei jeder Spiegelung anzugeben.
Start der Spiegelung
Nachdem Sie die benötigte Konfiguration ausgefüllt bzw. ein Set ausgewählt haben starten Sie die Spiegelung. Der Verlauf der Spiegelung wird in einem
Dialog protokolliert. Beim Ende der Spiegelung oder beim Abbruch wird eine Zusammenfassung ausgegeben und ein Report kann im Browser angezeigt werden.
Anzeigen der Reports
Von der lokalen Sitemap gelangen Sie zu den Reports (bzw. mit der URL: http://127.0.0.1:8080/mirror/).
Den gewünschten Report wählen Sie aus einer Liste aus. Ein Report enthält die verfolgten Links einer Spiegelung. Den Umfang der Anzeige können Sie einstellen:
- Anzahl der verfolgten Links pro Reportseite
- Sortierfolge der verfolgten Links
- Darstellung der Reportseite
In einem Report können Sie surfen.
|