À propos du contrôle à distance pour l'indexation

Chaque fois que votre site Web change, vous pouvez exécuter un script ou un programme demandant au robot de recherche d'exécuter un index à l'aide de la télécommande.

Utilisation de la commande à distance pour l'indexation

La demande d'indexation de contrôle à distance provient généralement d'un script ou d'un programme situé sur votre serveur.

Le robot effectue les mêmes étapes d'indexation que s'il avait été démarré manuellement à partir du menu Index. Pour envoyer une demande de contrôle à distance, vous devez configurer le mot de passe et les chaînes de réponse nécessaires.

Comment faire une demande de contrôle à distance

Pour effectuer une demande de contrôle à distance, utilisez les exemples de format suivants en fonction de l'emplacement de votre centre de données :

Emplacement du centre de données

Exemple

Londres

https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

Amérique du Nord

https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

Singapour

https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

ou

Chaîne et valeur

Description

sp_a= sp999999999

Votre numéro de compte.

Vous pouvez trouver votre numéro de compte sous Paramètres > Options de compte > Paramètres du compte .

sp_lines= N

Permet de vérifier l'état d'une analyse d'index en cours d'exécution.

N est un entier positif ou tout . S’il s’agit d’une valeur numérique, les dernières lignes N du fichier journal d’index correspondant sont incluses dans la réponse JSON.

Si la valeur est all , le fichier entier est renvoyé.

Si la valeur est 0 , aucune information de journal n'est renvoyée. Il s’agit de la valeur par défaut d’une requête d’état d’index en cours d’exécution.

sp_operation= op

Permet de spécifier l’une des opérations d’indexation suivantes à exécuter :

  • full_index

    Le robot de recherche exécute un index complet de votre site Web.

  • incremental_index

    Le robot de recherche exécute un index incrémentiel en utilisant la configuration définie sous Index > Index incrémentiel > Configuration.

  • vertical_index

    Le robot de recherche exécute une mise à jour verticale en utilisant la configuration définie sous Index > Mise à jour verticale > Configuration.

    Voir À propos de la mise à jour verticale.

  • script_index

    Le robot de recherche exécute un index incrémentiel à l’aide du fichier texte spécifié sous Index > Index par script > Configuration.

  • full_staged_index

    Le robot de recherche exécute un index complet par étape de votre site Web.

  • incremental_staged_index

    Le robot de recherche exécute un index échelonné incrémentiel en utilisant la configuration définie sous Index > Index incrémentiel > Configuration.

  • vertical_staged_index

    Le robot de recherche exécute une mise à jour verticale par étapes en utilisant la configuration définie sous Index > Mise à jour verticale > Configuration.

Remarque : Pour utiliser les mises à jour verticales, vous devrez peut-être les activer dans votre compte par le représentant de votre compte d'Adobe ou par l'assistance Adobe.

Voir À propos de la mise à jour verticale .

Vous pouvez ajouter _save à l'une des valeurs sp_operation ci-dessus pour que le robot de recherche tente d'utiliser le contenu enregistré. Par exemple, vous pouvez spécifier les éléments suivants :

sp_operation=full_index_saved

ou

sp_operation=full_staged_index_saved

Vous pouvez également ajouter _status à l'une des valeurs sp_operation ci-dessus pour demander un rapport d'état pour l'opération en cours ou la plus récente. Par exemple, vous pouvez spécifier les éléments suivants :

sp_operation=full_index_status

ou

sp_operation=full_staged_index_status

et les résultats sont renvoyés sous la forme d’un objet JSON. Insérez sp_lines=N pour inclure N lignes dans le fichier journal associé. Si N est négatif, les N dernières lignes sont incluses.

sp_operation= pushlive

Permet de diffuser à distance un index intermédiaire.

Toute tentative d’ajout de _save à l’opération de publication Push est ignorée.

Lorsque vous exécutez une opération push , une chaîne de texte de réponse OK, Priorité ou Erreur est renvoyée au serveur. Vous spécifiez ces chaînes de réponse sur la page Remote Control .

Voir Configuration du contrôle à distance pour l'indexation.

Si vous poussez en direct alors qu’il n’existe aucun index intermédiaire, rien ne se produit et la chaîne de réponse OK est renvoyée.

sp_password= xxxxxx

Mot de passe de la télécommande.

La recherche renvoie des données sous la forme d’une réponse HTTP appropriée. La réponse complète est composée d’un état HTTP, d’en-têtes de réponse HTTP, d’une ligne vide et de la chaîne de réponse.

Par exemple, supposons que vous effectuiez la demande de contrôle à distance suivante :

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

Voici la réponse du serveur :

Status: 200 OK 
Content-type: text/plain 
OK

Ou supposons que vous effectuiez la demande d'état de contrôle à distance suivante :

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

La réponse du serveur peut se présenter comme suit :

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

Pour obtenir les dix premières lignes de la liste des journaux associées à cette opération d'index, ainsi que son état, la requête suivante est utilisée :

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

Réponse du serveur :

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Notez la valeur offset. Cette valeur identifie la position de décalage de fichier dans le fichier journal où la lecture est laissée en arrière. Pour lire les dix lignes next du fichier, vous devez inclure, dans cet exemple, &sp_offset=672 dans la requête envoyée au serveur.

sp_offset permet de parcourir efficacement un fichier journal.

Pour obtenir les dernières lignes du journal, ainsi que l’état, indiquez le nombre comme nombre négatif. Par exemple, spécifiez sp_lines= avec la valeur -10 comme dans l’exemple suivant :

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

Réponse du serveur :

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

Notez qu’aucune valeur offset n’est renvoyée ici, car cette opération s’est terminée à la fin du fichier et qu’il n’y a plus de lignes à lire.

Configuration du contrôle à distance pour l'indexation

Chaque fois que votre site Web change, vous pouvez utiliser la télécommande pour exécuter un script ou un programme à partir de votre serveur, en demandant au robot de recherche d'exécuter un index.

Pour configurer le contrôle à distance pour l'indexation

  1. Dans le menu produit, cliquez sur Index > Remote Control.

  2. Sur la page Remote Control, définissez chaque option de champ de configuration pour pouvoir envoyer automatiquement une demande d'indexation de votre serveur afin d'indexer votre site Web.

    Option

    Description

    Mot de passe de contrôle à distance

    Indiquez le mot de passe de la télécommande.

    Les mots de passe sont sensibles à la casse (au moins six caractères) et doivent contenir au moins une lettre. Il est recommandé d’inclure également au moins un nombre.

    N’utilisez pas le mot de passe de connexion de recherche/marchandisage de votre site.

    Votre mot de passe est utilisé dans chaque demande de contrôle à distance.

    Chaîne de réponse OK

    Permet de spécifier une chaîne de texte de réponse OK si l’opération d’index demandée commence avec succès. Dans ce cas, le robot de recherche renvoie au serveur votre chaîne de réponse OK.

    Chaîne de réponse prioritaire

    Si une autre opération d'indexation est en cours lorsque la demande distante est effectuée, le robot de recherche ne peut pas exécuter l'index demandé. Dans ce cas, votre chaîne de texte de réponse Priorité est renvoyée au serveur.

    Chaîne de réponse d’erreur

    Permet de spécifier une chaîne de texte de réponse d’erreur Si votre mot de passe est incorrect ou si une autre erreur se produit. Dans ce cas, le robot de recherche renvoie à nouveau au serveur votre chaîne de réponse d’erreur.

  3. Cliquez sur Save Changes.

Sur cette page