Häufig gestellte Fragen

Adobe Flash

Eine Seite mit häufig gestellten Fragen, die die Unterstützung der Indizierung und Suche von SWF-Dateien auf einer Website behandelt.

Im Folgenden werden häufig gestellte Fragen zu SWF-Dateien behandelt:

Wann wird eine SWF-Datei durchsucht und indiziert?

Eine SWF-Datei wird durchsucht und indiziert, wenn sie in einem Einbettungs- oder Objekt-Tag auf einer HTML-Seite enthalten ist, wie im folgenden Beispiel:

<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

Eine SWF-Datei wird auch erkannt, wenn Sie die Datei-URL als Einstiegspunkt Liste haben.

Siehe Hinzufügen mehrerer URL-Einstiegspunkte, die indiziert werden sollen.

Was muss ich tun, um eine SWF-Datei zu indizieren?

Um SWF-Dateien zu suchen und zu indizieren, wählen Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types).

Solange auf Ihre Flash-Datei von einem <embed>-Tag oder einem <object>-Tag in einem HTML-Dokument verwiesen wird, wird der Text indiziert und alle in der Datei aufgelisteten URLs werden durchsucht.

Wenn Ihre Datei nicht über ein <embed>-Tag oder ein <object>-Tag referenziert wird, können Sie die SWF-Datei in einem <a href=...>-Tag in einem HTML-Dokument oder als URL-Einstiegspunkt Liste werden.

Siehe Hinzufügen mehrerer URL-Einstiegspunkte, die indiziert werden sollen.

Wie werden SWF-Dateien erkannt?

SWF-Dateien werden durch den folgenden MIME-Typ identifiziert:

application/x-shockwave-flash

SWF-Dateien werden auch mit den MIME-Typen application/octet-stream"oder text/plain erkannt, vorausgesetzt, die Dateierweiterung lautet .swf.

Ein falsch konfigurierter Server verwendet möglicherweise einen anderen MIME-Typ für SWF-Dateien. Überprüfen Sie unbedingt die Serverkonfiguration, wenn beim Crawling und Indizieren von SWF-Dateien Probleme auftreten.

Wie werden SWF-Dateien indiziert?

In einer SWF-Datei enthaltener Text wird indiziert, als wäre er <body>-Text auf der umschließenden HTML-Seite. Wenn ein Suchergebnis Text findet, der in einer eingebetteten SWF-Datei enthalten ist, wird das Ergebnis tatsächlich mit der einschließenden HTML-Seite und nicht mit der SWF-Datei verknüpft. Auf diese Weise wird die SWF-Datei im richtigen Kontext angezeigt.

Wenn eine SWF-Datei eine URL als Aktion "Film laden"enthält, wird der Text in der referenzierten SWF-Datei als Teil der umschließenden HTML-Seite indiziert.

Wenn eine SWF-Datei eine URL als Aktion "URL abrufen"enthält, wird die URL zu einem späteren Zeitpunkt durchsucht und indiziert, genau wie eine HTML-Referenz <a href=...> durchsucht und später indiziert wird.

Wenn eine SWF-Datei als URL-Einstiegspunkt aufgeführt wird, wird der Text der SWF-Datei als eine einzige Seite indiziert. Ein Suchergebnis, das Text von einer Einstiegs-SWF-Verknüpfung direkt zum Film findet, nicht zu einer umschließenden HTML-Seite.

Siehe Hinzufügen mehrerer URL-Einstiegspunkte, die indiziert werden sollen.

Zählt eine SWF-Datei als Seite?

Nein. Eine SWF-Datei wird als Teil ihrer umschließenden HTML-Seite betrachtet. Alle in SWF-Dateien enthaltenen "Film laden"-URLs gelten auch als Teil der umschließenden HTML-Seite. Daher zählen SWF-Dateien, auf die von einer HTML-Seite verwiesen wird, nicht als "Seite"für den Gesamtwert der Kontoseite.

Wenn eine SWF-Datei als URL-Einstiegspunkt aufgeführt ist, werden diese SWF-Datei und alle in dieser SWF-Datei aufgelisteten "Film laden"-URLs als eine "Seite"für die Gesamtsumme der Kontoseite gezählt.

Wie kann ich die Indizierung einzelner SWF-Dateien verhindern?

Um die Indexierung einer SWF-Datei zu verhindern, können Sie dem umschließenden HTML-Dokument entweder ein robots-Meta-Tag ( <meta name="ROBOTS" content="NOINDEX">) oder ein <noindex>-Tag hinzufügen. Das heißt, das Dokument, das das <embed>- oder <object>-Tag enthält.

Sie können auch das Meta-Tag “robots”( <meta name="ROBOTS" content="NOFOLLOW">) verwenden, um folgende URLs zu verhindern, die in der SWF-Datei enthalten sind. Wenn das einschließende HTML-Dokument die Option "Folgende"deaktiviert hat, werden die in der SWF-Datei als "URL abrufen"aufgelisteten URLs nicht befolgt.

Wie kann ich verhindern, dass SWF-Dateien auf meiner Website indiziert werden?

Um die SWF-Indexierung zu deaktivieren, deaktivieren Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types).

Sie können auch URL Masks verwenden, um die Indizierung von SWF-Dateien zu deaktivieren.

Siehe Hinzufügen von URL-Masken zum Index oder nicht zum Indexieren von Teilen von….

Um die SWF-Indexierung zu deaktivieren, geben Sie eine der folgenden URL-Masken ein:

  • exclude *.swf (wenn Sie keine regulären Ausdrücke verwenden)
  • exclude regexp ^.*\.swf$ (wenn Sie reguläre Ausdrücke verwenden)

Siehe Reguläre Ausdruck.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen SWF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus SWF-Dateien ab, die mit Adobe Flash erstellt wurden. Der UTF-8 enthält keine Angabe der Sprache. Wenn Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die von der SWF-Datei verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Ältere SWF-Dateien geben auch keinen Zeichensatz an. Wenn Sie den SWF-Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen den Zeichensatz angeben, der in der SWF-Datei verwendet wird.

Allgemeine Suche

Eine Seite mit häufig gestellten Fragen, auf der erläutert wird, wie Site-Suche/Merchandising Kunden, die Ihre Website besuchen, dabei unterstützt, das zu finden, wonach sie suchen.

Bei der allgemeinen Suche stellen sich folgende Fragen:

Im Folgenden werden häufig gestellte Fragen zu Suchfunktionen aufgeführt:

Muss ich irgendeine Software installieren, um Site-Suche/Merchandising zu verwenden?

Nein. Dies ist der Hauptvorteil von Site-Suche/Merchandising. Die Engine ist eine professionelle Anwendung, die komplett auf unseren Hochleistungsservern gehostet und gewartet wird. Dadurch wird die Software einfacher zu verwenden als andere Suchlösungen. Sie müssen nur eine kleine Menge HTML-Code zu Ihren Seiten hinzufügen, damit Kunden Ihrer Website Suchvorgänge eingeben können. Die Site-Suche/Merchandising kümmert sich um den Rest.

Was passiert, wenn meine Site das Seitenlimit überschreitet?

Wir führen weiterhin Suchvorgänge durch, damit Ihre Besucher Ihre Website ohne Unterbrechung durchsuchen können. Überprüfen Sie Ihren vollständigen Indexstatus oder das Live-Protokoll, um festzustellen, ob Ihre Website die Seitenbegrenzung überschreitet.

Siehe Über vollständigen Index.

Siehe Anzeigen des vollständigen Indexprotokolls einer Live- oder Stage….

Wie ändere ich die E-Mail-Adresse, an die die wöchentlichen Berichte gesendet werden?

Wöchentliche Berichte werden an den Eigentümer jedes aktiven Kontos gesendet. Sie können die E-Mail-Adresse ändern, indem Sie auf Settings > My Profile > Personal Information klicken. Wenn Sie mehr als ein aktives Suchkonto haben, werden alle Newsletter an die neue Adresse gesendet.

Siehe Konfigurieren Ihrer persönlichen Benutzerinformationen.

Wie sicher sind meine Kundeninformationen bei der Suche/dem Merchandising auf der Site?

Site-Suche/Merchandising ist sicher, schnell, stabil und einfach zu verwenden. Sie sind nicht gezwungen, Cookies zu verwenden (wenn Sie möchten, können Sie dies aber tun), und vertrauliche Informationen wie Passwörter werden niemals auf einen URL-Link gesetzt, der später von Ihrem Browser abgerufen werden kann.

Was ist mit der Privatsphäre meiner Kundeninformationen?

Die Adobe setzt sich dafür ein, die Privatsphäre ihrer Kunden und Besucher zu wahren. Siehe Adobe Datenschutzzentrum.

Kann ich meine eigenen Banneranzeigen auf den Suchergebnisseiten anzeigen?

Ja. Sie steuern das Erscheinungsbild und den Inhalt der Suchergebnisse. In der Suchergebnisvorlage für Ihre Website können Sie Links zu Ihrem eigenen Banneraustauschnetzwerk wie LinkExchange oder SmartClicks erstellen. Alle Treffer Ihrer Besucher werden Ihrem Bannerbörsenkonto gutgeschrieben.

Kann ich die Suchergebnisse für meine Site anpassen?

Ja. Dies ist eine exklusive Funktion der Site-Suche/des Merchandisings. Mit unserer fortschrittlichen Vorlagentechnologie und einem wenig Wissen über HTML können Sie genau steuern, wie die Suchergebnisse aussehen.

Siehe Suchvorlagen-Tags.

Die Transition zwischen Ihren eigenen Servern und den Site-Such-/Merchandising-Servern ist für Ihre Kunden völlig nahtlos und unsichtbar. Wenn Sie HTML nicht kennen oder keine Zeit haben, eine benutzerdefinierte Vorlage zu erstellen, können Sie aus einer Reihe von attraktiven, einsatzbereiten Vorlagen wählen, die von einem internen Team professioneller Webentwickler von der Adobe erstellt werden.

Kann ich sehen, nach welchen Kunden auf meiner Site gesucht wird?

Ja. Wir führen Suchstatistiken für Suchvorgänge durch, die von Besuchern auf Ihrer Website in den letzten zwei Monaten durchgeführt wurden. Sie können diese Statistiken jederzeit unter Berichte im Produktmenü überprüfen. Suchberichte geben Ihnen wichtige Informationen darüber, was Besucher auf Ihrer Website genau suchen. Sie können diese Informationen verwenden, um das Design zu verbessern oder die Site-Suchmaschine/Merchandising-Engine so einzustellen, dass sie Ihren Besuchern besser entspricht.

Wie kann ich steuern, welche Inhaltstypen (PDF, Text, Flash, MP3 und Microsoft Office) indiziert und gesucht werden?

Sie können auf einfache Weise Konten konfigurieren, um die Indizierung und Suche von Text in PDF-Dokumenten, Dokumenten mit Normaltext, Flash-, MP3- oder Microsoft Office-Dokumenten zu aktivieren oder zu deaktivieren.

Diese Einstellungen werden auf der Seite Staged Content Types gesteuert.

Siehe Inhaltstypen.

Werden dynamisch generierte Webseiten mit ASP-, JSP-, PHP-, CFM- oder Perl-basierten Inhalten unterstützt?

Statische oder dynamisch generierte HTML-Webseiten werden indiziert, einschließlich Seiten, die aus Datenbanken erstellt wurden, oder jedes andere Back-End-Verfahren. Da der HTML-Code, den ein Browser sieht, indiziert ist, können Sie Site-Suche/Merchandising auf Websites verwenden, solange diese Back-End-Architekturen HTML-Seiten ergeben.

Der Suchroboter durchsucht Ihre Website, indem er mit der ersten Seite an der in Account Settings angegebenen Website-Adresse beginnt und Links von Seite zu Seite verfolgt.

Siehe Konfigurieren Ihrer Kontoeinstellungen.

Wenn der Suchroboter alle Seiten Ihrer Website durchsucht und indiziert, können Sie die Suchmaschine verwenden, um Ihre Site zu suchen. Mit anderen Worten, wenn dynamisch generierte Dokumente mit Links von anderen Seiten in Ihre Website eingebunden werden, kann der Suchroboter trotzdem durchsuchen und den dynamischen Inhalt indizieren.

Nachdem der Inhalt Ihrer Website durchsucht und indexiert wurde, können Kunden Ihrer Website nach Informationen im indizierten Inhalt suchen.

Wie kann ich Synonyme verwenden, um die Suchergebnisse für meine Site zu verbessern?

Sie können Synonyme verwenden, wenn Sie möchten, dass Besucher Seiten finden, die mit ihrer Abfrage in Verbindung stehen.

Angenommen, Sie haben eine Seite, die eine Liste von Produkten enthält, die auf Ihrer Site zum Verkauf angeboten werden. Nach der Prüfung der Suchberichte, die durch Site-Suche/Merchandising bereitgestellt werden, stellen Sie jedoch fest, dass Kunden bei ihren Suchvorgängen nach dem Wort "Kosten", "Kosten", "Gebühr"oder "Gebühr"suchen. Diese Wörter zeigen Ihre Preisseite nicht in den Suchergebnissen an. Mit der Funktion Add Synonyms in Dictionaries können Sie angeben, dass diese Wörter alle Synonyme sind, und Ihr Kunde kann Ihre Liste finden, unabhängig davon, welchen Suchbegriff er verwendet.

Siehe Info zu Wörterbüchern.

Habe ich die Kontrolle über die Reihenfolge der Suchergebnisse?

Ja. Mithilfe der Benutzeroberfläche für erweiterte Relevanz können Sie steuern, welche Seiten für eine bestimmte Abfrage zurückgegeben werden. Diese Funktion ist nützlich, wenn Sie sicherstellen möchten, dass Kunden bei der Abfrage bestimmter Wörter eine bestimmte Seite sehen.

Siehe Hinzufügen eines neuen Meta-Tag-Felds.

Kann ich die Sprache der Suchergebnisseite ändern?

Ja. Die Vorlage für die Site-Suche/das Merchandising ist flexibel, wenn es darum geht, eine Ergebnisseite zu erstellen, die die Sprache Ihrer Wahl verwendet und mit dem Erscheinungsbild Ihrer Website übereinstimmt.

Die Vorlage besteht aus einer Kombination aus Text, Standard-HTML-Tags und speziellen Tags, die zur Anzeige der Suchergebnisse definiert werden. Wenn ein Kunde eine Suche durchführt, liest der Suchroboter die Vorlage, gibt den Text mit standardmäßigen HTML-Tags aus und fügt die Ergebnisverknüpfungen auf der Grundlage der speziellen Vorlagen-Tags ein.

Siehe Suchvorlagen-Tags.

Wenn Sie die Sprache der Ergebnisse ändern möchten, können Sie den englischen Text bearbeiten, der in der Vorlage angezeigt wird.

Siehe Bearbeiten einer Präsentation oder einer Transportvorlage.

Kann ich mehr als eine Site auf meiner Adobe Kundenanmeldung haben?

Ja. Mit einer einzigen Adobe Kundenanmeldung können Sie eine andere Suchmaschine für viele verschiedene Websites verwalten. Wählen Sie Konten unter "Konten"aus und verwalten Sie sie.

Siehe Auswahl eines anderen Kontos, das verwendet werden soll.

Kann ich mehr als eine Domäne suchen?

Ja. Sie können den Zugriff auf mehrere Domänen mithilfe von URL Entrypoints konfigurieren. Geben Sie URL-Einstiegspunkte für zusätzliche Domänen an, deren Inhaber Sie sind. Denken Sie daran, dass Sie über die Berechtigung zum Indexieren von Domänen verfügen müssen, deren Inhaber Sie nicht sind.

Siehe Informationen zu URL-Einstiegspunkten.

Kann ich meine Site in separate Abschnitte unterteilen, damit Kunden diese Bereiche einzeln oder die gesamte Site durchsuchen können?

Ja. Eine Funktion "Sammlungen"ist enthalten, mit der Kunden bestimmte Bereiche Ihrer Website suchen können, um schnell das zu finden, wonach sie suchen.

Siehe Sammlungen.

Kunden können beispielsweise eine Sammlung von URLs im Zusammenhang mit Produktverkaufsinformationen oder eine Sammlung von URLs im Zusammenhang mit Supportdiensten suchen. Sie können Sammlungen so einrichten, dass Ihren Kunden eine Dropdown-Liste mit Sammlungen oder eine Gruppe von Kontrollkästchen angezeigt wird.

Wie kann ich Teile meiner Website von der Suche ausschließen?

Ja. Geben Sie URL-Masken an, um festzulegen, welche Webseiten in die Indexierung einbezogen oder ausgeschlossen werden sollen. URL-Masken bestimmen, ob Webseiten in den Suchergebnissen angezeigt werden.

Siehe URL-Masken.

Siehe Skript "URL-Masken".

Um zu verhindern, dass Teile einzelner Webseiten durchsucht werden, können Sie Teile einer Seite von der Indexierung ausschließen. Richten Sie den Text mit den Tags <noindex> und </noindex> ein. Diese Methode ist nützlich, wenn Sie Navigationstext von Suchvorgängen ausschließen möchten.

Welche Zeichensätze werden unterstützt?

Webseiten geben den Zeichensatz normalerweise mit einem Meta-Tag an, das dem Folgenden ähnelt:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

Die Site-Suchmaschine/Merchandising indiziert Webseiten ordnungsgemäß mit allen gängigen Zeichensätzen, die heute im Internet verwendet werden. Einige der unterstützten Zeichensätze umfassen Folgendes:

Arabisch (ISO-8859-6)

Chinesisch (traditionell) Big5)

Japanisch (Shift_JIS)

Arabisch (Windows-1256)

Chinesisch (traditionell) EUC-TW)

Russisch (KOI8-R)

Ostsee (ISO-8859-4)

Kyrillisch (ISO-8859-5)

Südeuropäisch (ISO-8859-3)

Baltic (Windows-1257)

Kyrillisch (Windows-1251)

Türkisch (ISO-8859-9)

Mitteleuropäisch (ISO-8859-2)

Griechisch (ISO-8859-7)

Türkisch (Windows-1254)

Mitteleuropäisch (Windows-1250)

Griechisch (Windows-1253)

Unicode (UTF-8)

Chinesisch (ISO-2022-CN)

Hebräisch (ISO-8859-8)

US-ASCII (us-ascii)

Chinesisch (ISO-2022-CN-EXT)

Hebräisch (Windows-1255)

Westeuropäisch (ISO-8859-1)

Chinesisch (vereinfacht) EUC-CN)

Japanisch (EUC-JP)

Westeuropäisch (ISO-8859-15)

Chinesisch (vereinfacht) GB2312)

Japanisch (ISO-2022-JP)

Westeuropäisch (Windows-1252)

Chinesisch (vereinfacht) GBK)

Japanisch (ISO-2022-JP-1)

Westeuropäisch (x-mac-roman)

Chinesisch (vereinfacht) HZ-GB-2312)

Japanisch (ISO-2022-JP-2)

Wenden Sie sich an den technischen Support, wenn Sie Fragen zu den oben nicht aufgelisteten Zeichensätzen haben.

Was ist, wenn ich meine Website ändere oder aktualisiere?

Nachdem Sie den Inhalt Ihrer Website geändert haben, können Sie entweder einen vollständigen oder einen inkrementellen Index durchführen. Die Site-Suche/das Merchandising lädt alle geänderten Website-Inhalte herunter und indiziert diese. Nach Abschluss der Indexierung können Ihre Kunden den neuen Inhalt durchsuchen. Sie können auch eine automatische Indexierung Ihrer Site zu einem bestimmten Zeitpunkt und an einem bestimmten Tag planen.

Siehe Ausführen eines vollständigen Indexes einer Live- oder Staged-Website….

Siehe Ausführen eines inkrementellen Indexes einer Live- oder Staged-Website….

Siehe Einstellen des vollständigen Indexplans für eine Live-Website.

Siehe Einstellen des inkrementellen Indexplans für eine Live-Website.

Kann meine Site automatisch indiziert werden?

Ja. Sie können jeden Tag einen automatischen Index Ihrer Site planen.

Neben der täglichen automatischen Indizierung können Sie festlegen, dass häufig geänderte Teile ihrer Site inkrementell indiziert werden. An Tagen, für die ein automatischer Index geplant ist, können Sie steuern, wann der Index stattfindet. Außerdem können Sie jederzeit manuell einen Site-Index starten, wann immer Sie möchten.

Siehe Einstellen des vollständigen Indexplans für eine Live-Website.

Siehe Einstellen des inkrementellen Indexplans für eine Live-Website.

Ich verwende Kennwörter auf meiner Website. Kann ich weiterhin Site-Suche/Merchandising verwenden?

Wenn Sie die HTTP Basic-Authentifizierung zum Schutz bestimmter Bereiche Ihrer Website mit einem Kennwort verwenden, können Sie Bereiche und Kennwörter angeben, mit denen die Site-Suche/Merchandising Ihre Site indizieren kann.

Siehe Passwörter für den Zugriff auf Bereiche Ihrer Website, die erforderlich sind, hinzufügen….

Unterstützen Sie das Crawling und Indizieren von HTTPS oder sicheren Serverinhalten?

Ja. Sie können Inhalte auf sicheren Servern (https) suchen und indizieren.

Erfüllt Site-Suche/Merchandising die Datei "robots.txt"auf meiner Website?

Ja. Das Robots-Ausschlussprotokoll ist konform. Der Suchroboter prüft die Datei "robots.txt", wenn sie auf Ihrer Website vorhanden ist. Wenn Ihre Datei "robots.txt"alle Roboter vom Crawling Ihrer Site ausschließt, wird auch der Site-Such-/Merchandising-Roboter ausgeschlossen. Damit nur der Site-Such-/Merchandising-Roboter Ihre Site durchsuchen kann, stellen Sie den Inhalt Ihrer Datei "robots.txt"auf Folgendes ein:

User-agent: Atomz/1.0 
Disallow:
User-agent: * 
Disallow: /

Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:

https://www.robotstxt.org/orig.html

Bestimmte Teile meiner Website müssen regelmäßig aktualisiert werden, damit meine Kunden die genauesten Suchergebnisse erhalten. Hilft die inkrementelle Indexierung bei diesem Problem?

Ja. Dieses Szenario wurde mit der inkrementellen Indexierungsfunktion erstellt, um die Site-Suche/das Merchandising zu erleichtern. Der Hauptvorteil der inkrementellen Indizierung besteht darin, dass Firmen häufig dynamisch verändernde Bereiche ihrer Website indizieren können. Diese Funktion stellt sicher, dass Sie Suchergebnisse mit einer Genauigkeit von "bis zur Minute"anzeigen.

Siehe Ausführen eines inkrementellen Indexes einer Live- oder Staged-Website….

Siehe Einstellen des inkrementellen Indexplans für eine Live-Website.

Werden dynamisch generierte Webseiten von einer Back-End-Datenbank wie Produktkatalogen oder Lagerbestandsverwaltungssystemen unterstützt?

Statische oder dynamisch erstellte HTML-Webseiten, einschließlich Seiten, die aus Datenbanken erstellt wurden, oder andere Back-End-Prozesse werden indiziert. Da der von einem Browser angezeigte HTML-Code indiziert ist, können Sie die Site-Suche/das Merchandising auf Websites verwenden, solange die Back-End-Datenbankinformationen HTML-Seiten ergeben.

Der Suchroboter durchsucht Ihre Website, indem er mit der ersten Seite an der in Account Settings angegebenen Website-Adresse beginnt und Links von Seite zu Seite verfolgt.

Siehe Konfigurieren Ihrer Kontoeinstellungen.

Wenn der Suchroboter alle Seiten Ihrer Website durchsucht und indiziert, können Sie die Suchmaschine verwenden, um Ihre Site zu suchen. Mit anderen Worten, wenn dynamisch generierte Dokumente mit Links von anderen Seiten in Ihre Website eingebunden werden, kann der Suchroboter weiterhin den dynamischen Datenbankinhalt durchsuchen und indizieren.

Nachdem der Inhalt Ihrer Website durchsucht und indexiert wurde, können Kunden Ihrer Website nach Informationen im indizierten Inhalt suchen.

Sie können auf einfache Weise die Suche nach vollständigem Inhalt oder eine engere themenbasierte Suche aktivieren, die auf Informationen im Titel, die Metadaten-Beschreibung, die Meta-Keywords-Dokument-Tags oder alle drei beschränkt ist. Mithilfe von Metadatendefinitionen können Sie auch benutzerdefinierte Anzeigefelder, z. B. ein Produktbild, in den Suchergebnissen erstellen.

Siehe Hinzufügen eines neuen Meta-Tag-Felds.

Kann ich Skripten oder Programme verwenden, um einen inkrementellen Index meiner Site zu initiieren?

Ja. Sie können Skripten oder Programm verwenden, um einen inkrementellen Index Ihrer Website zu initiieren und die Server zu pten, um die Site zu indizieren, sobald Inhalte geändert oder aktualisiert werden.

Siehe Über skriptgesteuerten Index.

Funktionsimplementierungen

Eine Seite mit häufig gestellten Fragen, die verschiedene Funktionsimplementierungen in Search&Promote erläutert.

Die folgenden Fragen stellen sich häufig nach Funktionsimplementierungen in Search&Promote auf einer Website:

Warum laufen meine Geschäftsregeln nicht?

Konfigurieren Sie Geschäftsregeln, wenn Banner angezeigt werden, oder entscheiden Sie, welche Ergebnisse in welcher Reihenfolge angezeigt werden. Sie können auch die Position eines Elements in Ihrer Facette und die Vorlage für eine bestimmte Suche konfigurieren.
Ordnen Sie Geschäftsregeln neu an, um die Reihenfolge zu ändern, in der sie auf Präsentationsvorlagen ausgeführt werden. Geschäftsregeln werden in der Reihenfolge ausgeführt, in der sie festgelegt wurden. d. h. je höher die Ordnungsnummer einer Regel ist, desto später wird sie im Prozess ausgeführt, wodurch frühere Regeln übertroffen werden. Sie können Regeln neu anordnen, indem Sie auf der Seite "Geschäftsregeln"in die Spalte "Reihenfolge"der Tabelle eine neue Zahl eingeben.

Siehe Geschäftsregeln.

Warum habe ich Probleme bei der Planung der Indexierung, Fehler beim Starten der Indexierung und Probleme beim Starten der Indexierung?

Wenn Sie einen Index generieren, unabhängig davon, ob er vollständig oder inkrementell ist, werden die Informationen zum Index-Crawl-Status in Echtzeit angezeigt. Sie können beispielsweise die Ansicht der Zeitdauer des Beginns, der Zeitdauer und alle während des Indexvorgangs aufgetretenen Fehler durchführen. Informationen zum Status des letzten Index werden ebenfalls angezeigt. Verwenden Sie diese Informationen, um etwaige Indexierungsfehler zu beheben.

Informationen zum Planen eines Indexes finden Sie unter Einstellen des vollständigen Indexplans für eine Live-Website und Einstellen des inkrementellen Indexplans für eine Live-Website.

Informationen zum Starten eines gestaffelten Indexes finden Sie unter Ausführen eines vollständigen Indexes einer Live- oder Staged-Website… oder Ausführen eines inkrementellen Indexes einer Live- oder Staged-Website….

Meine Indexgrößenbeschränkung überschreitet meine zulässige Grenze. Warum passiert das und wie repariere ich es?

Eine Website kann tendenziell wachsen und im Laufe der Zeit Search&Promote "entdeckt" mehr Dokumente und Webseiten hinzugefügt wurden. Eventuell überschreitet Ihr Konto möglicherweise Ihre Indexgrößenbeschränkung. In solchen Fällen können Sie URL Mask verwenden. Diese Funktion blendet Dokumente und Webseiten bei Index-Crawling aus, die Sie nicht indizieren möchten oder nicht benötigen, und reduziert so Ihre Indexgröße. Eine andere Möglichkeit könnte darin bestehen, sich an den technischen Support zu wenden, um die Indexierungsgrößenbegrenzung in Ihrem Konto zu erhöhen.

Siehe URL-Masken.

Wenn Sie sich nicht sicher sind, was Sie tun sollen, wenden Sie sich an den technischen Support. Es kann noch viele andere Variablen geben, die sich auf Ihre Indexgröße auswirken und bei einer Anpassung auch die Rechnungsstellung Ihres Kontos beeinflussen können.

International

Eine Seite mit häufig gestellten Fragen, die die Unterstützung der Indizierung und Suche in mehr als 19 Sprachen beschreibt, einschließlich Multibyte-asiatischer Sprachen wie Chinesisch (vereinfacht und traditionell), Japanisch und Koreanisch.

Im Folgenden werden häufig gestellte Fragen zu Sprachen und Zeichensätzen behandelt:

Was steuert die Zeichensatzkodierung der Abfrage?

Der Abschnitt "Webformulare"Ihres Suchkontos enthält Mustersuchformulare, die Sie verwenden, um Ihrer Website Suchfunktionen hinzuzufügen. Wenn Sie diesen Suchformularcode betrachten, können Sie eine Zeile wie die folgende finden:

<input type=hidden name="sp_f" value="iso-8859-1">

Diese Codezeile teilt der Suchmaschine mit, dass die eingehende Abfrage in iso-8859-1 kodiert ist, einer gängigen Kodierung für westeuropäische Sprachen. Sie können diese Einstellung ändern, indem Sie im Produktmenü auf Settings > My Profile > Personal Information klicken. Wählen Sie auf der Seite Personal Information in der Dropdown-Liste Character Encoding eine neue Kodierung aus.

Siehe Konfigurieren Ihrer persönlichen Benutzerinformationen.

Sie können den Kodierungswert auf Ihren Webseiten auch manuell ändern, indem Sie die Zeile sp_f des Suchformulars bearbeiten. Denken Sie daran, dass der Wert des Suchformulars mit der Zeichensatzkodierung der Seite, auf der es angezeigt wird, übereinstimmen muss.sp_f

Werden nur Seiten durchsucht, deren Kodierung mit der Kodierung der Abfrage übereinstimmt?

Standardmäßig ist "Nein" eingestellt. Solange Ihre Webseiten die Zeichensatzkodierung richtig identifizieren, werden die erforderlichen Konvertierungen zwischen der Kodierung der Abfrage und der der Seiten vorgenommen, auch wenn die Seiten mehrere Kodierungen verwenden.

Welche Kodierung wird für die Suchergebnisseite verwendet?

Die Zeichensatzkodierung Ihres Kontos bestimmt die Standardkodierung für Ihre Ergebnisvorlage.

Siehe Konfigurieren Ihrer persönlichen Benutzerinformationen.

Weitere Informationen zum Festlegen eines Zeichensatzes in einer HTML-Vorlage erhalten Sie.

Siehe Suchvorlagen-Tags.

Kann ich Site-Suche/Merchandising auf Unicode-, UTF-8-, kodierten Seiten verwenden?

Ja. Unicode-Zeichensätze wie UTF-8 bieten jedoch nicht genügend Informationen, um die Sprache zu bestimmen, in der die Seiten geschrieben werden. Um diese Seiten korrekt zu durchsuchen, müssen Sie die Sprache angeben. Zur Bestimmung der Sprache des Dokuments werden die Informationen in der folgenden Reihenfolge verarbeitet:

  • Content-Language HTTP-Header, der vom Server für das Dokument bereitgestellt wird.

  • META-Elemente (z. B. META HTTP-EQUIV="Content-Language" Content="ja_JP") im Bereich <HEAD> des Dokuments.

  • LANG-Attribut des Tags <HTML> (z. B. <HTML LANG="ja_JP">).

Wenn Ihr Server nicht für die Bereitstellung des Content-Language-HTTP-Headers konfiguriert ist und Ihre Dokumente weder das Sprach-META-Element noch das Sprachattribut für das <HTML>-Tag enthalten, können Sie Metadaten-Injektionen verwenden, um die entsprechende Sprache anzugeben.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen PDF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus Adobe PDF-Dateien ohne Angabe von Sprache ab. Wenn Sie PDF Documents ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in der PDF-Datei verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen SWF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus Adobe-Flash-Filmdateien ab, die mit Adobe Flash ohne Angabe von Sprache erstellt wurden. Wenn Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in der SWF-Datei verwendet wird.

Bei SWF-Dateien der Flash-Version 4 oder älter wird der Zeichensatz der Zeichen in der Datei nicht angegeben. Wenn Sie den Inhaltstyp Adobe Flash Movies ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe von Metadaten-Injektionen den Zeichensatz angeben, der in der SWF-Datei verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen Microsoft Office-Dateien auf meiner Website nicht durchsuchen kann?

Bei der Site-Suche/beim Merchandising wird UTF-8 aus Microsoft Office-Dateien (Microsoft Word, Microsoft Excel und Microsoft PowerPoint) ohne Angabe der Sprache abgerufen. Wenn Sie den Inhaltstyp Microsoft Office Files ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe der Metadaten-Injektionen die Sprache angeben, die in den Microsoft Office-Dateien verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen MP3-Dateien auf meiner Website nicht durchsuchen kann?

Wenn Sie den Inhaltstyp Text in MP3 Music Files ( Settings > Crawling > Content Types) auswählen, müssen Sie Metadaten-Injektionen verwenden, um den Zeichensatz anzugeben, der zum Kodieren der MP3-Dateien verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Muss ich etwas Besonderes tun, um die .txt-Dateien auf meiner Website korrekt zu indizieren?

Wenn Sie den Inhaltstyp Text Documents ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe von Metadaten-Injektionen den Zeichensatz angeben, der zum Kodieren der .txt-Dateien verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Wie kommt es, dass chinesische, japanische oder koreanische Schriftarten in den Suchergebnissen unter Netscape 4.7 und früher erscheinen?

Wenn Ihr Konto die Standardvorlage, eine der gebrauchsfertigen Vorlagen oder eine Vorlage verwendet, die auf einer dieser Vorlagen basiert, kann es Schriftart-Tags enthalten, die Arial oder Helvetica als Schriftart angeben. Zum Beispiel <font face="arial, helvetica" size="+1">. In Netscape 4.7 und früher werden keine chinesischen, japanischen oder koreanischen Zeichen angezeigt, wenn die Schriftart Arial oder Helvetica verwendet wird. Entfernen Sie das Attribut face oder ersetzen Sie die Schriftart durch eine Schrift, die für Chinesisch, Japanisch oder Koreanisch geeigneter ist.

Niedrige Seitenzahl

Eine Seite mit häufig gestellten Fragen, die häufig auftretende Probleme im Zusammenhang mit einer niedrigen Indexierung der Seite behandelt.

Im Folgenden werden häufig gestellte Fragen zu Seitenzahlen mit niedriger Indexierung aufgeführt:

Haben Sie Ihr Indexprotokoll geprüft?

Das Index-Protokoll enthält detaillierte Informationen, die der Site-Such-/Merchandising-Roboter beim Indizieren Ihrer Website erfasst. Das Protokoll enthält eine Liste von durchgekrackten Links und aufgetretenen Fehlern. Die Überprüfung des Indexprotokolls ist der beste Ort, um zu ermitteln, warum nicht alle Seiten auf Ihrer Website indiziert sind.

Siehe Anzeigen des vollständigen Indexprotokolls einer Live- oder Stage….

Siehe Anzeigen des inkrementellen Indexprotokolls einer Live- oder Stage….

Haben Sie Tippfehler in Ihrer URL?

Wenn Sie längere URLs in HTML-Formulare eingeben, kann es zu einem oder mehreren Schreibfehlern kommen. Beachten Sie, dass URLs keine Leerzeichen enthalten dürfen. Beachten Sie außerdem, dass bei einigen Webservern die Groß- und Kleinschreibung bei URLs beachtet wird.

Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints. Überprüfen Sie auf der Seite Staged URL Entrypoints Folgendes:

  • Sie haben keine typografischen Fehler in Ihren URLs.
  • Die Zeichen in den URLs verwenden alle das richtige Gehäuse.
  • Die URLs enthalten keine Leerzeichen.

Um Ihre URL-Einstiegspunkte zu testen, kopieren Sie eine URL und fügen Sie sie in einen Webbrowser ein, um zu sehen, ob Ihre Website angezeigt wird. Wenn sie nicht angezeigt wird, überprüfen Sie erneut, um sicherzustellen, dass Sie keine Fehler im URL-Pfad gemacht haben.

Siehe Informationen zu URL-Einstiegspunkten.

Verfügt die Einstiegspunkt-Webseite über Links zu anderen Seiten Ihrer Website?

Der Site-Such-/Merchandising-Roboter durchsucht Ihre Website genau wie Ihr Kunde. durch Befolgen von Links von Seite zu Seite. Links müssen auf der Einstiegsseite vorhanden sein, bevor der Suchroboter andere Seiten auf Ihrer Site finden und indizieren kann.

Siehe Hinzufügen mehrerer URL-Einstiegspunkte, die indiziert werden sollen.

Sind Links zu anderen Seiten Ihrer Website in JavaScript eingebettet?

Sie können ausgefeilte Navigationstechniken auf Ihrer Website verwenden, z. B. Rollover-Aktionen und Menüs, bei denen JavaScript zur Verknüpfung mit anderen Seiten verwendet wird. Der Site-Such-/Merchandising-Roboter kann jedoch keine in JavaScript eingebetteten Links verfolgen.

Eine Lösung, die Sie zur Behebung dieses Problems verwenden können, besteht darin, versteckte Links zu anderen Seiten im HTML-Code zu platzieren, die das JavaScript enthalten. Obwohl Kunden auf Ihrer Website diese Links nicht sehen, findet und durchsucht der Suchroboter sie immer noch. Sie können verborgene Tags am unteren Rand der Seite direkt vor dem </body>-Tag platzieren. Sie können wie folgt aussehen:

<a href="/mydir/mypag1.html"></a> 
<a href="/mydir/mypag2.html"></a>

Eine andere Lösung besteht darin, die URLs der zusätzlichen Seiten auf Ihrer Website als Einstiegspunkte für Crawl und Index Liste. Beginnen Sie die URLs mit https://, wie im Folgenden gezeigt:

https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

Siehe Hinzufügen mehrerer URL-Einstiegspunkte, die indiziert werden sollen.

Sind die HTML-Tags auf Ihrer Webseite in einer ungültigen Reihenfolge?

Die HTML-Spezifikation erfordert, dass die Tags <html>, <head> und <body> einer bestimmten Sequenz in einem HTML-Dokument folgen. Tags auf allen Webseiten müssen die folgende Reihenfolge aufweisen:

<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

Wenn die HTML-Tags nicht in der richtigen Reihenfolge angeordnet sind, kann der Site-Such-/Merchandising-Roboter Ihre Webseite nicht richtig analysieren und indizieren. Im Folgenden finden Sie ein Beispiel für Tags, die sich nicht in der richtigen Reihenfolge befinden:

<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

In diesem Fall platzieren Sie die Tags <html>, <head> und <body> in der richtigen Reihenfolge auf Ihrer Webseite.

Haben Sie auf Ihrer Webseite falsch formatierte HTML-Kommentar-Tags?

Stellen Sie sicher, dass Sie ungültige HTML-Kommentare in Ihren Webseiten sorgfältig überprüfen und korrigieren.

Die HTML-Spezifikation verlangt, dass ein HTML-Kommentar mit den Zeichen <!-- und mit den Zeichen --> beginnt. Es ist einfach, falsch formatierte Kommentare zu übersehen, die dazu führen, dass der Site-Such-/Merchandising-Roboter die Tags auf Ihrer Webseite falsch analysiert. Ein falsch formatierter Kommentar kann dazu führen, dass der Site-Such-/Merchandising-Roboter andere wichtige Tags verpasst, die analysiert werden müssen. Achten Sie auf Kommentare kurz vor dem <body>-Tag in Ihrer Webseite.

Im Folgenden finden Sie ein Beispiel für einen ordnungsgemäß formatierten Kommentar:

<!-- This HTML comment is OK. -->

Im Folgenden finden Sie ein Beispiel für fehlerhafte Kommentare:

<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

Enthält Ihre Webseite Links zu Seiten in einer anderen Domäne?

Oft kann eine Website aus Seiten bestehen, die tatsächlich auf einem Webserver mit einer anderen Domänenadresse vorhanden sind. Wenn Ihre Haupt-Website-Adresse beispielsweise folgende ist:

https://www.mydomain.com/

Ihre Website kann auch Seiten in einer anderen Domäne wie der folgenden enthalten:

https://www.otherdomain.com/

Standardmäßig folgen die Links des Site-Such-/Merchandising-Roboters nicht auf einer anderen Domäne als der Hauptdomäne. Indem Sie jedoch zusätzliche Einstiegspunkte für Ihr Suchkonto festlegen, können Sie problemlos mehrere Domänen indizieren.

Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints. hinzufügen der "Haupt-Website-Einstiegspunkt"-URL Ihrer Site. Fügen Sie dann weitere URL-Einstiegspunkte zu allen anderen Domänen hinzu, die Siteseiten enthalten. Sie würden z. B. Ihren URL-Haupteinstiegspunkt auf Folgendes setzen:

https://www.mydomain.com/

und fügen Sie den folgenden zusätzlichen Site-URL-Einstiegspunkt hinzu:

https://www.otherdomain.com/

Verwenden Sie einen virtuellen Domänendienst für Ihre URL?

Möglicherweise verwenden Sie einen virtuellen Domänendienst (manchmal auch als "Domänenumleitungsdienst"bezeichnet), um eine bessere URL für Kunden bereitzustellen, die zu Ihrer Website gelangen. Angenommen, die Adresse Ihrer Website lautet wie folgt:

https://www.myispdomain.com/~myname/mywebpages/

Sie verwenden jedoch einen virtuellen Domänendienst, damit Kunden unter folgenden Adressen zu Ihrer Site gelangen können:

https://myname.adomain.com/

oder

https://adomain.com/myname/

Standardmäßig folgen die Links des Site-Such-/Merchandising-Roboters nicht auf einer anderen Domäne als der Hauptdomäne. Indem Sie jedoch zusätzliche Einstiegspunkte für Ihr Suchkonto festlegen, können Sie problemlos mehrere Domänen indizieren.

Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints. hinzufügen der "Haupt-Website-URL-Einstieg" auf den virtuellen Domänennamen Ihrer Site. Fügen Sie dann der Domäne, in der sich Ihre Website befindet, weitere Einstiegspunkte hinzu.

Sie würden z. B. den Haupteinstiegspunkt der URL auf Folgendes setzen:

https://myname.adomain.com/

Fügen Sie den folgenden zusätzlichen URL-Einstiegspunkt der Website hinzu:

https://www.myispdomain.com/~myname/mywebpages/

Verwendet Ihre Webseite ein Meta-Aktualisierungs-Tag?

Viele Websites haben eine Titelseite, die ein Meta-Aktualisierungs-Tag zwischen den <head>...</head>-Tags enthält, ähnlich dem Folgenden:

<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">

Unter bestimmten Umständen ist der Site-Suchroboter/Merchandising nicht in der Lage, der Meta-Aktualisierungs-URL zu folgen, um den Inhalt Ihrer Website zu indizieren. Dieses Problem lässt sich einfach umgehen, indem Sie zusätzliche Einstiegspunkte festlegen.

Klicken Sie im Produktmenü auf Settings > Crawling > URL Entrypoints. hinzufügen einen weiteren Einstiegspunkt zur URL des Meta-Aktualisierungs-Tags.

Verwendet Ihre Webseite ein Meta-Roboter-Tag?

Manchmal verwenden Webseiten Meta-Robots-Tags, um Webroboter zu steuern, die regelmäßig versuchen, eine Website zu durchsuchen. Meta-Roboter-Tags werden zwischen den <head>...</head>-Tags einer Webseite angezeigt und sehen ähnlich wie das folgende Tag aus:

<meta name="robots" content="noindex, nofollow">

Da der Site-Such-/Merchandising-Roboter selbst ein Webroboter ist, folgt er den Anweisungen des Meta-Roboter-Tags. Indem Sie andere Roboter auf diese Weise ausschließen, schließen Sie auch den Site-Such-/Merchandising-Roboter aus.

Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:

https://www.robotstxt.org/orig.html

Entfernen oder ändern Sie das Meta-Robots-Tag auf den Webseiten, die Sie auf Ihrer Website indizieren möchten.

Verwendet Ihre Website eine Ausschlussdatei für Roboter?

Manchmal hat eine Website eine Seite namens "robots.txt", die alle oder bestimmte Roboter vom Crawling ausschließt. Um zu sehen, ob Ihre Website eine Datei "robots.txt"enthält, suchen Sie diese direkt unter der Domäne der obersten Ebene, wie im Folgenden gezeigt:

https://www.yourdomain.com/robots.txt

Der Inhalt der Datei "robots.txt"ähnelt dem folgenden Text:

User-agent: * 
Disallow: /

Da der Site-Such-/Merchandising-Roboter selbst ein Webroboter ist, folgt er den Anweisungen in der Datei "robots.txt". Er schließt den Site-Such-/Merchandising-Roboter aus. Um dieses Problem zu umgehen, bearbeiten Sie die Ausschlussdatei für Roboter (robots.txt), damit der Site-Such-/Merchandising-Roboter Ihre Website wie folgt durchsuchen und indizieren kann:

User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

Eine Seite mit häufig gestellten Fragen, die die Unterstützung der Indizierung und Suche von Microsoft® Office-Dateien auf einer Website behandelt.

Im Folgenden werden häufig gestellte Fragen zu Microsoft Office-Dateien aufgeführt:

Was wird in einer Microsoft Office-Datei indiziert?

Der vollständige Inhalt von Microsoft Word-, Microsoft Excel- und Microsoft PowerPoint-Dateien wird indiziert.

Die folgenden Teile einer Microsoft Word-Datei werden indexiert:

  • Titel
  • Keywords
  • Betreff (Beschreibung)
  • Textbasierter Inhalt
  • Hyperlinks zu anderen Dokumenten

Die folgenden Teile einer Microsoft Excel-Datei werden indexiert:

  • Titel
  • Schlüsselwörter
  • Betreff (Beschreibung)
  • Text in Zellen
  • Werte aus numerischen Formeln in Zellen

Die folgenden Teile einer Microsoft PowerPoint-Datei werden indexiert:

  • Titel
  • Schlüsselwörter
  • Betreff (Beschreibung)
  • Text auf jeder Folie

Was wird nicht in einer Microsoft Office-Datei indiziert?

Grafiken, die in Microsoft Office-Dateien enthalten sind, oder Text, der Teil einer enthaltenen Grafik ist, werden nicht indiziert. Benutzerdefinierte Eigenschaftsdefinitionen werden nicht als Metadaten indiziert. Einige Texte in speziellen Feldern, wie Kopf- und Fußzeilen in einer PowerPoint-Datei, werden ebenfalls nicht indiziert.

Wie unterscheiden sich Microsoft Office-Dateien von HTML-Seiten?

Der Unterschied zwischen der Indizierung von Microsoft Office- und HTML-Dateien durch den Suchroboter besteht darin, dass jede HTML-Datei eine einzelne Seite und eine einzelne Microsoft Office-Datei Hunderte von Seiten darstellen kann. Aus diesem Grund wird jede Seite in einer Microsoft Office-Datei als separate Seite unter Ihrem Suchkonto gezählt.

Wie kann ich verhindern, dass Microsoft Office-Dateien auf meiner Website indiziert werden?

Wenn Sie nicht möchten, dass der Suchroboter Microsoft Office-Dateien durchsucht und indiziert, deaktivieren Sie den Inhaltstyp Microsoft Office Files ( Settings > Crawling > Content Types).

Sie können auch URL Masks verwenden, um die Indizierung von Microsoft Office-Dateien zu deaktivieren.

Geben Sie die folgenden URL-Masken ein:

Wenn Sie keine regulären Ausdrücke verwenden

  • exclude *.doc
  • exclude *.xls
  • exclude *.ppt

Wenn Sie reguläre Ausdruck verwenden

  • exclude regexp ^.*\\.doc$
  • exclude regexp ^.*\\.xls$
  • exclude regexp ^.*\\.ppt$

Siehe Hinzufügen von URL-Masken zum Index oder nicht zum Indexieren von Teilen von….

Siehe Reguläre Ausdruck.

MP3

Eine Seite mit häufig gestellten Fragen, die die Unterstützung der Indizierung und Suche von MP3-Musikdateien auf einer Website behandelt.

Im Folgenden finden Sie allgemeine Fragen zu MP3-Dateien.

Wann wird eine MP3-Datei durchsucht und indiziert?

MP3-Dateien werden auf zweierlei Weise durchsucht und indiziert. Am häufigsten stammt der Weg von einem Anker-href-Tag in einer HTML-Datei:

<a href="MP3-file-URL"></a>

Eine zweite Möglichkeit besteht darin, die URL der MP3-Datei als URL-Einstiegspunkt einzugeben.

Siehe Informationen zu URL-Einstiegspunkten.

Was muss ich tun, um die MP3-Dateien auf meiner Site zu durchsuchen und zu indizieren?

Klicken Sie zum Aktivieren des Crawling und Indizierens von MP3 für Ihr Konto im Produktmenü auf Settings > Crawling > Content Types. Wählen Sie auf der Seite Staged Content Types Text in MP3 Music Files aus.

Siehe Inhaltstypen.

Wie wird eine MP3-Datei erkannt?

Eine MP3-Datei wird durch ihren MIME-Typ "audio/mpeg"erkannt.

Was ist in einer MP3-Datei indiziert?

MP3-Dateien speichern optional eine kleine Menge an Textinformationen. Diese Informationen können den Namen des Albums, den Namen des Künstlers, den Titel des Liedes, das Musikgenre, das Jahr der Veröffentlichung und einen Kommentar enthalten. Diese Informationen werden am Ende der Datei im so genannten TAG gespeichert. MP3-Dateien, die TAG-Informationen enthalten, werden wie folgt indiziert:

  • Der Titel des Liedes wird wie der Titel einer HTML-Seite behandelt.
  • Der Kommentar wird wie eine für eine HTML-Seite definierte Beschreibung behandelt.
  • Das Genre wird wie ein für eine HTML-Seite definierter Suchbegriff behandelt.
  • Der Künstlername, der Albumname und das Veröffentlichungsjahr werden wie der Hauptteil eines HTML-Dokuments behandelt.

Zählt eine MP3-Datei als Seite?

Ja, jede MP3-Datei, die auf Ihrer Website durchsucht und indiziert wird, wird als eine Seite gezählt.

Wie kann ich die Indizierung einzelner MP3-Dateien verhindern?

Umschließen Sie die Anker-Tags, die mit den Tags <nofollow> und </nofollow> mit den MP3-Dateien verknüpft sind. Der Suchroboter folgt nicht den Verknüpfungen zwischen diesen Tags.

Eine andere Methode besteht darin, die URLs der MP3-Dateien als Ausschlussmasken hinzuzufügen.

Siehe URL-Masken.

Siehe Skript "URL-Masken".

Wie kann ich verhindern, dass MP3-Dateien indiziert werden?

Die einfachste Möglichkeit, die MP3-Indexierung für Ihr Konto zu steuern, ist die Deaktivierung von Text in MP3 Music Files auf der Staged Content Types-Seite.

Siehe Auswählen von Inhaltstypen zum Crawl und Indexieren.

Sie können auch die Funktion "URL-Masken"verwenden, um die MP3-Indexierung nach Dateierweiterung zu deaktivieren. Klicken Sie dazu im Produktmenü auf Settings > Crawling > URL Masks. Geben Sie eine der folgenden Masken ein:

Wenn Ihr Konto...

Geben Sie die folgende URL-Maske ein

Verwendet keine regulären Ausdruck

exclude *.mp3

Verwendet reguläre Ausdruck

exclude regexp ^.*\.mp3$

Siehe Reguläre Ausdruck.

Warum kann ich die chinesischen, japanischen oder koreanischen MP3-Dateien auf meiner Site nicht durchsuchen?

Um nach chinesischen, japanischen oder koreanischen MP3-Dateien zu suchen, klicken Sie im Produktmenü auf Settings > Crawling > Content Types > Text in MP3 Music Files. Klicken Sie dann auf Settings > Metadata > Injections und geben Sie den Zeichensatz an, der zum Kodieren der MP3-Dateien verwendet wird.

Siehe Auswählen von Inhaltstypen zum Crawl und Indexieren.

Siehe Info zu Injektionen.

PDF

Auf der Seite mit häufig gestellten Fragen wird die Unterstützung der Indizierung und Suche von PDF-Dateien auf einer Website diskutiert.

Im Folgenden werden häufig gestellte Fragen zu PDF-Dateien behandelt:

Was wird in einer PDF-Datei indiziert?

Der gesamte Inhalt von PDF-Dateien wird indiziert. Die folgenden Teile einer PDF-Datei werden indexiert:

  • Titel
  • Schlüsselwörter
  • Betreff (Beschreibung)
  • Textbasierter Inhalt

Was wird nicht in einer PDF-Datei indiziert?

Das PDF-Inhaltsverzeichnis, Grafiken in der Datei oder Text, der Teil einer enthaltenen Grafik ist, werden nicht indiziert.

Wie werden indizierte PDF-Dateien gezählt?

Jede PDF-Datei, einschließlich PDF-Dateien mit mehreren Seiten, wird als ein einziges Dokument gezählt.

Können die Suchergebnisse ein PDF-Symbol anzeigen?

Ja. Verwenden Sie das <search-if-link-extension>-Tag in Ihrer Vorlage, um ein PDF-Symbol oder andere Grafiken oder Text in die Suchergebnisse einzuschließen:

<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif"> 
  </search-if-link-extension> 
  ... 
</search-results>

PDF-Symbole helfen Ihren Kunden zu wissen, dass ein Suchergebnis mit einer PDF-Datei verknüpft ist, die sehr groß sein kann. Die Dateigröße kann für Kunden von Bedeutung sein, die über ein Modem oder ein Mobilgerät auf Ihre Website zugreifen.

Können die Suchergebnisse mit einer bestimmten Seite in einer PDF-Datei verknüpft werden?

Ja. Mithilfe des Vorlagen-Tags für intelligente Links ( <search-smart-link>...</search-smart-link>) können Kunden auf die erste PDF-Seite klicken, die das Suchergebnis enthält.

Um intelligente Links zu verwenden, ersetzen Sie die Tags <search-link>...</search-link> im Suchergebnisbereich Ihrer Vorlage durch <search-smart-link>...</search-smart-link>-Tags. Wenn ein Kunde auf einen Link klickt, den die Smart-Link-Tags generieren, wird die erste PDF-Abfrage aufgerufen, die für die Suche relevant ist.

NOTE

Um diese Funktion nutzen zu können, muss der Kunde eine neuere Version des Adobe Acrobat- oder Adobe Acrobat-Readers verwenden, die das Hervorhebungs-Plug-in und das externe Window Handler (EWH)-Plug-In enthalten muss. Darüber hinaus muss der Webbrowser das Adobe Acrobat-Plugin für Netscape Navigator (Sie können jeden Browser verwenden, der dieses Netscape Navigator-Plug-In akzeptiert) oder das Acrobat ActiveX-Steuerelement für Internet Explorer 4.0 und höher verwenden.

Siehe Suchvorlagen-Tags.

Wie kann ich verhindern, dass PDF-Dateien auf meiner Website indiziert werden?

Wenn Sie nicht möchten, dass der Suchroboter PDF-Dateien durchsucht und indiziert, deaktivieren Sie den Inhaltstyp PDF Documents ( Settings > Crawling > Content Types).

Sie können auch URL Masks verwenden, um die PDF-Indexierung zu deaktivieren.

Siehe Hinzufügen von URL-Masken zum Index oder nicht zum Indexieren von Teilen von….

Um die PDF-Indexierung zu deaktivieren, geben Sie eine der folgenden URL-Masken ein:

  • exclude *.pdf (wenn Sie keine regulären Ausdrücke verwenden)
  • exclude regexp ^.*\.pdf$ (wenn Sie reguläre Ausdrücke verwenden)

Siehe Reguläre Ausdruck.

Wie kommt es, dass ich die chinesischen, japanischen oder koreanischen PDF-Dateien auf meiner Website nicht durchsuchen kann?

Site-Suche/Merchandising ruft UTF-8 aus PDF-Dateien ohne Angabe der Sprache ab. Wenn Sie den Inhaltstyp PDF Documents ( Settings > Crawling > Content Types) ausgewählt haben, müssen Sie mithilfe von Metadaten-Injektionen die Sprache angeben, die in der PDF-Datei verwendet wird.

Siehe Hinzufügen von Feldinjizierungsdefinitionen.

Zu viele Seiten

Auf der Seite mit häufig gestellten Fragen werden einige Gründe erläutert, warum der Indexer mehr Seiten gezählt hat, als Sie tatsächlich haben, und wie die Lösung in jedem Fall aussieht.

Wenn Sie sicher sind, dass Ihre Website unter Ihrer Seitenbegrenzung liegt, der Indexer Ihnen jedoch mitteilt, dass die Grenze erreicht ist, sollten Sie diese allgemeinen Fragen und Antworten auf mögliche Lösungen überprüfen.

Haben Sie Ihre verschiedenen Indexprotokolle geprüft?

Das Index-Protokoll enthält detaillierte Informationen, die vom Site-Such-/Merchandising-Roboter gesammelt wurden, während es Ihre Website indiziert. Das Protokoll enthält eine Liste aller durchgeknackten Links und enthält Fehler. Die Überprüfung des Indexprotokolls ist der beste Ort für Beginn, wenn Sie ermitteln möchten, welche Seiten indiziert werden.

Siehe Anzeigen des vollständigen Indexprotokolls einer Live- oder Stage….

Siehe Anzeigen des inkrementellen Indexprotokolls einer Live- oder Stage….

Siehe Ansicht des skriptgesteuerten inkrementellen Index-Protokolls einer Live- oder….

Siehe Anzeigen des neu generierten Indexprotokolls einer Live- oder Stage….

Siehe Anzeigen des neu bewerteten Index-Protokolls einer Live- oder Staged-Website.

Werden CGI-Programm auf Ihrer Website indiziert?

CGI-Programm verwenden URL-Parameter, die manchmal dazu führen, dass der Indexer mehrere "gefälschte"URLs durchsucht. Wenn Site-Suche/Merchandising Ihre CGI-Programm liest und URLs mit CGI-Parametern folgt, werden wahrscheinlich mehrere Vielfache Seiten durchsucht und indiziert, die für Ihren Suchindex nicht nützlich sind. Typische CGI-Parameter werden in URLs mit ?- oder &-Zeichen angezeigt.

Mithilfe der Funktion "URL-Masken"können Sie die CGI-Programm von der Indexierung ausschließen. Sie können ein URL-Präfix maskieren oder reguläre Ausdruck verwenden, um Ihre CGI-Skripte zu maskieren.

Siehe URL-Masken.

Siehe Skript "URL-Masken".

Siehe Reguläre Ausdruck.

Ist das Durchsuchen von Ordnern auf Ihrem Server aktiviert?

Wenn auf einem Webserver das Durchsuchen von Ordnern aktiviert ist und in einem bestimmten Verzeichnis keine Datei "index.html"vorhanden ist, kann ein Besuch dieses Ordners die Auflistung der Dateien in diesem Verzeichnis anzeigen. Normalerweise befinden sich Links am oberen Seitenrand, mit denen Sie die Liste auf unterschiedliche Weise sortieren können, indem Sie einfach auf Name, Last modified, Size usw. klicken. Normalerweise erscheinen diese im Site-Index-Protokoll für Suche/Merchandising als URLs mit Zeichen wie ?M=A am Ende. Der Site-Such-/Merchandising-Impulszähler folgt diesen als Links, was dazu führen kann, dass mehrere "gefälschte"URLs indiziert werden.

Normalerweise enthält eine gut konzipierte Website entweder Indexdateien in jedem Verzeichnis, oder das Durchsuchen von Ordnern ist für Ordner ohne Indexdateien deaktiviert. Glücklicherweise gibt es eine einfache Möglichkeit, diese "gefälschten"URLs zu maskieren, wenn Sie Ihre Seiten nicht ändern oder Ordnerauflistungen auf der Serverseite deaktivieren können.

Um diese Aufgabe durchzuführen, klicken Sie auf Settings > Crawling > URL Masks. hinzufügen einer Maske, um jede URL zu maskieren, die das Zeichen ? enthält. Sie können diese Aufgabe ausführen, indem Sie die folgende Maske für regulären Ausdruck eingeben:

exclude regexp ^.*\?.*$

Nachdem Sie die Maske erstellt haben, stellen Sie sicher, dass Sie Ihre Website neu indizieren.

Siehe Ausführen eines vollständigen Indexes einer Live- oder Staged-Website….

Siehe Ausführen eines inkrementellen Indexes einer Live- oder Staged-Website….

Gibt es Foren oder Newsgruppen auf Ihrer Website?

Wenn Foren oder Newsgruppen auf Ihrer Website durchsucht werden, können URLs für verschiedene Anzeigeoptionen oder Sortieroptionen folgen. Dieses Verhalten bedeutet, dass dieselbe Seite mehrmals indiziert wird.

In der Regel verfügen Foren oder Newsgroups über eigene Suchmaschinen. In diesem Fall können Sie URL Masks verwenden, um die Foren von der Site-Suche/Merchandising zu maskieren.

Klicken Sie im Produktmenü auf Settings > Crawling > URL Masks. Maskieren Sie auf der Seite Staged URL Masks Ihre Foren, indem Sie ihre URLs als URL-Masken zum Ausschließen eingeben.

Siehe Hinzufügen von URL-Masken zum Index oder nicht zum Indexieren von Teilen von….

Nachdem Sie die Masken erstellt haben, stellen Sie sicher, dass Sie Ihre Website neu indizieren.

Siehe Ausführen eines vollständigen Indexes einer Live- oder Staged-Website….

Siehe Ausführen eines inkrementellen Indexes einer Live- oder Staged-Website….

Gibt es PDF- oder Microsoft Office-Dateien auf Ihrer Website?

Wenn Sie PDF-Dateien oder Microsoft Office-Dateien auf Ihrer Website haben, werden Sie möglicherweise feststellen, dass die Indexgröße von nur wenigen Dateien viele Seiten zählt. Der Grund dafür, dass mehr Seiten indiziert werden als Dokumente, ist, dass jede Seite in einer PDF- oder Microsoft Office-Datei als separate Seite gezählt wird.

Klicken Sie im Produktmenü auf Index > Full Index > Live Index. Wählen Sie auf der Seite Full Index die Option Count All Pages und klicken Sie dann auf Full Index Now, um die Gesamtanzahl der Seiten anzuzeigen. Wenn PDF- oder Microsoft Office-Dateien nicht indiziert werden sollen, können Sie diesen Inhaltstyp unter Settings > Crawling > Content Types deaktivieren.

Siehe Ausführen eines vollständigen Indexes einer Live- oder Staged-Website….

Siehe Inhaltstypen.

Haben Sie mehrere URL-Einstiegspunkte?

Der Site-Such-/Merchandising-Roboter beginnt mit dem Crawling an bestimmten URL-Einstiegspunkten und folgt allen gefundenen Links zu allen Inhalten in dieser bestimmten Domäne. Wenn Sie viele URL-Einstiegspunkte angegeben haben, wird möglicherweise eine erhebliche Anzahl von Seiten durchsucht.

Verwenden Sie das nofollow-Tag des Robots-Ausschlussprotokolls in den Kopfzeilen der Einstiegspunkte-Dokumente auf den zusätzlichen Domänen wie folgt:

<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

Der obige Code weist den Site-Such-/Merchandising-Roboter an, den Inhalt der Seite zu indizieren, aber nicht den Links zu zusätzlichen Seiten zu folgen.

Weitere Informationen zu Webrobotern und dem Roboter-Ausschlussprotokoll finden Sie unter:

https://www.robotstxt.org/orig.html

Wenn Sie keinen Zugriff auf die Quelle der Seiten auf zusätzlichen Domänen haben, können Sie die Einstiegspunkte für mehrere URLs entfernen. Auf diese Weise können Sie die Indizierung der Aktivität nur auf Domänen beschränken, deren Inhalte Sie von Kunden durchsuchen können möchten.

Siehe Informationen zu URL-Einstiegspunkten.

Haben Sie die internen Bytes oder die Zeitbeschränkungen der Site-Suche/Merchandising überschritten?

Überprüfen Sie im Bildschirm "Vollständiger Indexstatus", ob Ihr Konto seine Grenze erreicht hat. Wenn der Status meldet, dass Ihr Index größer als erlaubt ist oder dass es länger dauerte als erlaubt, wird Ihre Website nicht vollständig indiziert. Sie können diesen Fehler korrigieren, damit Sie eine angemessene Abdeckung und Anzahl der Webseiten erhalten.

Zum Schutz der Site-Such-/Merchandising-Server gibt es interne Beschränkungen für Bytes und Zeit. Nur wenn durchgekrackte Dateien sehr groß sind oder wenn der Server, auf den Site-Suche/Merchandising versucht, langsam erreicht wird, werden diese Beschränkungen erreicht.

Wenn Sie eine Zeitbegrenzung erreicht haben, stellen Sie sicher, dass Ihr Server online ist, und versuchen Sie den Index zu einem späteren Zeitpunkt erneut. Wenn Sie die maximale Anzahl an Bytes erreichen, überprüfen Sie die durchgecrawenen Dateien, indem Sie Ihr Indexprotokoll anzeigen. Sind sie ungewöhnlich groß? Wenden Sie sich an den technischen Support, wenn eine dieser Meldungen angezeigt wird.

Auf dieser Seite