Mit einem skriptgesteuerten Index können Sie inkrementelle Indexierungsoptionen erstellen, aktualisieren und verwalten, ohne sich anmelden zu müssen. Der Suchroboter liest Anweisungen aus einer Textdatei, die auf Ihrem Server gehostet wird.
Um skriptgesteuerten Index zu verwenden, geben Sie auf der Seite "Konfiguration des inkrementellen Index"die URL zu einer Skriptdatei (einer Textdatei) an, die sich auf Ihrem Server befindet. Zum Beispiel https://www.mysite.com/indexlist.txt
. Wenn sich Ihre Site ändert, können Sie der Textdatei entweder manuell oder automatisch Befehlsblöcke hinzufügen (mit einem Skript, das durch die Eingabe von Informationen aus einem News-Feed, einem Stock-Ticker oder einer anderen geänderten Datei ausgelöst wird).
Wenn der skriptgesteuerte inkrementelle Index beginnt, liest der Suchroboter die Textdatei und führt die neuen Befehle aus, die in dieser Datei gefunden werden. Standardmäßig verarbeitet der Suchroboter nur die neuen Befehle, die vom Dateidatum bestimmt werden. Sofern Sie zum Zeitpunkt der Konfiguration des skriptgesteuerten Index nicht Clear Date aktivieren, "speichert"der Suchroboter den Datumsbezeichner des zuletzt verarbeiteten Blocks.
Die Skriptdatei, die Sie in der URL angeben, ist eine Textdatei, die sich auf Ihrem Server befindet. Sie können Wagenrückgaben, Zeilenvorschub oder beides für die Endsequenz verwenden. Eine leere Zeile enthält null oder mehr Leerzeichen, gefolgt von einer Zeilenende-Sequenz. Bei allen Befehlen wird nicht zwischen Groß- und Kleinschreibung unterschieden.
Die Textdatei ist in Blöcken angeordnet, die die Informationen beschreiben, die der Suchroboter bei der Durchführung eines skriptgesteuerten Inkrementalindex verwendet.
Blöcke werden nach Datum sortiert, wobei die ältesten Blöcke am Anfang der Textdatei und die letzten Blöcke am Ende angeordnet sind. Jeder Block beginnt mit einem einzeiligen Datums- und einem Datums-/Spezifizierer-Befehl und endet mit einem Leerzeilenzeichen, wie im folgenden Blockbeispiel dargestellt (dazwischen gibt es mehrere Befehle):
Bei Verwendung des HTTP 1.1-Stils ist für alle Datumsangaben mit einer Länge unter dem 10. eine vorangestellte Null erforderlich. Der 6. November ist beispielsweise 06. November, nicht der 6. November.
Befehl |
Beschreibung |
---|---|
date-command |
Die erste Zeile jedes Beginns mit einem von zwei Datumsbefehlen:
|
date-specifier |
Der Befehl date-specifier zeichnet in der Regel entweder das normale Datum und die Uhrzeit (Befehl "date") oder die Zeit in Sekunden (Befehl "seconds") auf, zu der die Blockinformationen der Datei hinzugefügt wurden. Beispiel: Bei Verwendung des HTTP 1.1-Stils ist für alle Datumsangaben mit einer Länge unter dem 10. eine vorangestellte Null erforderlich. Der 6. November ist beispielsweise 06. November, nicht der 6. November. Der Suchroboter "erinnert"sich an den Datumsbezeichner des zuletzt verarbeiteten Blocks und indiziert nur Informationen, die er als "neuer"ansieht. (Echtzeit spielt für den Suchroboter keine Rolle. Stattdessen kommt es auf die Zeit im Verhältnis zu anderen zuvor verarbeiteten Zeiten an.) Nachdem der Suchroboter beispielsweise einen Block mit einer Datumsangabe von 22.00 Uhr gelesen hat, werden keine Blöcke gelesen, die vor 22.00 Uhr aufgezeichnet wurden, unabhängig davon, wann der Indexvorgang ausgeführt wird. Im schlimmsten Fall können Sie versehentlich das Jahr "2040"anstelle von "2004"in Ihrer Datumsangabe eingeben. In einem solchen Fall indiziert der Suchroboter den 2040-Block während des nächsten Indizierungsvorgangs und weigert sich dann, alle anderen Informationsblöcke zu lesen (es sei denn, dass ein solcher Zeitraum 2040 ist). Wenn dies der Fall sein sollte, entfernen Sie alle zuvor verarbeiteten Blöcke aus der Textdatei, klicken Sie auf Datum löschen und veröffentlichen Sie es dann live. |
Kommentarzeile |
Beginnen Sie mit Kommentarzeilen mit dem Zeichen "#". Jede Kommentarzeile muss eine eigene Zeile sein. Sie können keine Kommentare zum Ende der Zeile eingeben. Eine Kommentarzeile wird nicht als Leerzeile betrachtet. Er kann auch an einer beliebigen Stelle in einem Block erscheinen, selbst vor einem Datums- oder Sekundenbefehl, wie im folgenden Beispiel: |
action-command |
Jeder Textblock kann beliebig viele Aktionsbefehle enthalten. Die folgenden Optionen für Aktionsbefehle entsprechen denen für die standardmäßige inkrementelle Indexierung:
|
Siehe auch URL-Masken.
Im folgenden Beispielskript-Dateibeispiel verarbeitet der Suchroboter die Blöcke, sofern die Datumsangabe nach dem Datum der Datumsangabe des zuletzt verarbeiteten Blocks erfolgt. Ist dies der Fall, werden die folgenden Indexierungsvorgänge ausgeführt:
Löscht y2k-problems.html
aus dem Index.
Fügt no-y2k-problems.html
zum Suchindex hinzu und folgt keinem der Links für no-y2k-problems.html
.
Schließen Sie beim Crawling URLs, die housewares.htm
und lightfixtures.htm
l entsprechen, aus dem Suchindex aus.
Schließen Sie alle anderen Ordner und Dokumente unter www.mydomain.com
ein.
Aktualisieren Sie alle Dokumente in den Ordnern products
und information
, indem Sie alle Links, die sich seit dem letzten Indexierungsvorgang geändert haben, durchsuchen und indizieren.
Schließen Sie beim Crawling URLs im Abschnitt archive
der Website aus, wenn sie am oder vor dem 1. Januar 1999 datiert sind.
Schließen Sie URLs, die housewares.html
und lightfixtures.html
entsprechen, aus dem Suchindex aus.
Indexdateien im Ordner help
, jedoch keine Links aus diesen Dateien durchsuchen oder indizieren.
Suchen und indizieren Sie alle anderen Dateien, die für www.mydomain.com
gefunden wurden.
# Start of file.
# Added by John Smith
date Sat, 01 Jan 2004 16:05:53 PST
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/
delete https://www.mydomain.com/y2k-problems.html
add https://www.mydomain.com/no-y2k-problems.html nofollow
date Sun, 02 Jan 2004 20:19:08 PST
# Added by the wire service updater
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/help/ nofollow
include https://www.mydomain.com/
# no add files, just update existing files
# update all files in the "products" directory
update https://www.mydomain.com/products/
# update all files in the "information" directory
update regexp ^https://www\.mydomain\.com/information/.*$
# End of file.
Sie können ein von Ihnen erstelltes Skript angeben, das einen inkrementellen Index schreibt, aktualisiert und verwaltet, ohne sich anmelden zu müssen. Der Suchroboter liest Anweisungen aus der Textdatei, die auf Ihrem Server gehostet wird, um den inkrementellen Index auszuführen.
So konfigurieren Sie einen skriptbasierten inkrementellen Index
Klicken Sie im Produktmenü auf Index > Scripted Index > Configuration.
Geben Sie auf der Seite Scripted Incremental Index Configuration in Script File URL die URL zum Skript für die Textdatei ein, das sich auf Ihrem Server befindet.
Siehe Über skriptgesteuerten Index.
(Optional) Markieren Sie Clear Date, wenn Sie nicht möchten, dass der Suchroboter die Datumsangabe des zuletzt verarbeiteten Blocks "speichert".
Standardmäßig verarbeitet der Suchroboter nur neue Befehlsblöcke, die in der Textdatei enthalten sind, die vom Datum der Datei bestimmt wird. Wenn Sie die Standardeinstellung nicht wünschen, aktivieren Sie Clear Date.
Klicken Save Changes.
(Optional) Führen Sie einen der folgenden Schritte aus:
Klicken Sie auf History, um alle vorgenommenen Änderungen wiederherzustellen.
Siehe Verwenden der Option Verlauf.
Klicken Live.
Siehe Live-Einstellungen anzeigen.
Klicken Push Live.
Siehe Pushing stage settings live.
Sie können die skriptgesteuerte inkrementelle Indexierung planen, die in regelmäßigen Abständen am Tag erfolgt.
Die gewählte Basiszeit ist lokal gemäß der Zeitzone, die in den Kontoeinstellungen konfiguriert ist.
Siehe Konfigurieren Ihrer Kontoeinstellungen.
Webserver sollen oft mitten in der Nacht zur Wartung aussteigen. Wenn Ihr Server während einer geplanten Indexzeit ausfällt, schlägt der Indexierungsvorgang fehl. Stellen Sie sicher, dass Sie eine Tageszeit auswählen, zu der der Webserver verfügbar ist.
Der Index-Plan gilt nur für Ihren Live-Index. Sie können keine gestaffelten inkrementellen Indizes planen.
So legen Sie den Zeitplan für den inkrementellen Index für eine Live-Website fest
Sie können Scripted Incremental Index verwenden, um "Teile"Ihrer Live- oder Stage-Website zu indizieren, z. B. eine Sammlung häufig geänderter Seiten, ohne sich anmelden zu müssen.
Um diese Funktion zu verwenden, müssen Sie eine skriptgesteuerte inkrementelle Indextextdatei konfigurieren.
Siehe Konfigurieren eines skriptgesteuerten Inkrementalindex.
So führen Sie einen skriptgesteuerten inkrementellen Index einer Live- oder Staged-Website aus
Führen Sie im Produktmenü einen der folgenden Schritte aus:
Klicken Scripted Index Now.
(Optional) Wenn Indexierungsfehler aufgetreten sind, klicken Sie auf View Errors, um das zugehörige Protokoll Ansicht.
Wenn ein vollständiger Livestream-Index oder ein gestaffelter vollständiger, skriptgebundener Index abgeschlossen ist, können Sie das zugehörige Protokoll zur Fehlerbehebung bei auftretenden Fehlern Ansicht haben.
Protokolle können weder exportiert noch gespeichert werden. Das Protokoll bleibt jedoch bis zum Auftreten des neuen Indexes zur Ansicht verfügbar.
Zur Ansicht des inkrementellen Indexprotokolls einer Live- oder Stage-Website
Führen Sie im Produktmenü einen der folgenden Schritte aus:
Klicken Sie auf Index > Scripted Index > Live Log.
Klicken Sie auf Index > Scripted Index > Staged Log.
Führen Sie auf der Protokollseite oben oder unten einen der folgenden Schritte aus:
Verwenden Sie die Navigationsoptionen First, Prev, Next, Last oder Go to line, um durch das Protokoll zu navigieren.
Verwenden Sie die Anzeigeoptionen Errors only, Wrap line oder Show, um Ihre Anzeige zu verfeinern.