Chaque fois que votre site Web change, vous pouvez exécuter un script ou un programme demandant au robot de recherche d'exécuter un index à l'aide de la télécommande.
La demande d'indexation de contrôle à distance provient généralement d'un script ou d'un programme situé sur votre serveur.
Le robot effectue les mêmes étapes d'indexation que s'il avait été démarré manuellement à partir du menu Index. Pour envoyer une demande de contrôle à distance, vous devez configurer le mot de passe et les chaînes de réponse nécessaires.
Pour effectuer une demande de contrôle à distance, utilisez les exemples de format suivants en fonction de l'emplacement de votre centre de données :
Emplacement du centre de données |
Exemple |
---|---|
Londres |
|
Amérique du Nord |
|
Singapour |
|
ou
Chaîne et valeur |
Description |
---|---|
sp_a= sp999999999 |
Votre numéro de compte. Vous pouvez trouver votre numéro de compte sous Paramètres > Options de compte > Paramètres du compte . |
sp_lines= N |
Permet de vérifier l'état d'une analyse d'index en cours d'exécution. N est un entier positif ou tout . S’il s’agit d’une valeur numérique, les dernières lignes N du fichier journal d’index correspondant sont incluses dans la réponse JSON. Si la valeur est all , le fichier entier est renvoyé. Si la valeur est 0 , aucune information de journal n'est renvoyée. Il s’agit de la valeur par défaut d’une requête d’état d’index en cours d’exécution. |
sp_operation= op |
Permet de spécifier l’une des opérations d’indexation suivantes à exécuter :
Remarque : Pour utiliser les mises à jour verticales, vous devrez peut-être les activer dans votre compte par le représentant de votre compte d'Adobe ou par l'assistance Adobe. Voir À propos de la mise à jour verticale . Vous pouvez ajouter _save à l'une des valeurs sp_operation ci-dessus pour que le robot de recherche tente d'utiliser le contenu enregistré. Par exemple, vous pouvez spécifier les éléments suivants : ou Vous pouvez également ajouter _status à l'une des valeurs sp_operation ci-dessus pour demander un rapport d'état pour l'opération en cours ou la plus récente. Par exemple, vous pouvez spécifier les éléments suivants : ou et les résultats sont renvoyés sous la forme d’un objet JSON. Insérez sp_lines=N pour inclure N lignes dans le fichier journal associé. Si N est négatif, les N dernières lignes sont incluses. |
sp_operation= pushlive |
Permet de diffuser à distance un index intermédiaire. Toute tentative d’ajout de _save à l’opération de publication Push est ignorée. Lorsque vous exécutez une opération push , une chaîne de texte de réponse OK, Priorité ou Erreur est renvoyée au serveur. Vous spécifiez ces chaînes de réponse sur la page Remote Control . Voir Configuration du contrôle à distance pour l'indexation. Si vous poussez en direct alors qu’il n’existe aucun index intermédiaire, rien ne se produit et la chaîne de réponse OK est renvoyée. |
sp_password= xxxxxx |
Mot de passe de la télécommande. |
La recherche renvoie des données sous la forme d’une réponse HTTP appropriée. La réponse complète est composée d’un état HTTP, d’en-têtes de réponse HTTP, d’une ligne vide et de la chaîne de réponse.
Par exemple, supposons que vous effectuiez la demande de contrôle à distance suivante :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index
Voici la réponse du serveur :
Status: 200 OK
Content-type: text/plain
OK
Ou supposons que vous effectuiez la demande d'état de contrôle à distance suivante :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status
La réponse du serveur peut se présenter comme suit :
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T10:58:58-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"status": 1,
"message": "ok"
}
Pour obtenir les dix premières lignes de la liste des journaux associées à cette opération d'index, ainsi que son état, la requête suivante est utilisée :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10
Réponse du serveur :
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T10:59:30-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"offset": 672,
"lines": [
"07/25 16:40:07 PST ======== Starting manual crawl of account sp99999999. ========",
"07/25 16:40:08 PST Loading existing data",
"07/25 16:40:08 PST Downloading entrypoint https://www.atomz.com/",
"07/25 16:40:08 PST Robots.txt exclude mask: https://www.atomz.com/snap",
"07/25 16:40:08 PST Exclude mask: regexp ^https://www.atomz.com/$",
"07/25 16:40:08 PST Include mask: https://www.atomz.com/",
"07/25 16:40:08 PST Downloading https://www.atomz.com/style.css",
"07/25 16:40:09 PST Ignoring https://www.atomz.com/style.css, document type 'text/css'.",
"07/25 16:40:09 PST Downloading https://www.atomz.com/privacy.html",
"07/25 16:40:09 PST Downloading https://www.atomz.com/terms.html"
],
"status": 1,
"message": "ok"
}
Notez la valeur offset
. Cette valeur identifie la position de décalage de fichier dans le fichier journal où la lecture est laissée en arrière. Pour lire les dix lignes next du fichier, vous devez inclure, dans cet exemple, &sp_offset=672
dans la requête envoyée au serveur.
sp_offset
permet de parcourir efficacement un fichier journal.
Pour obtenir les dernières lignes du journal, ainsi que l’état, indiquez le nombre comme nombre négatif. Par exemple, spécifiez sp_lines=
avec la valeur -10
comme dans l’exemple suivant :
https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10
Réponse du serveur :
Status: 200 OK
Content-type: application/json; charset=utf-8
{
"current_time": "2017-08-27T11:01:14-0700",
"start_time": "2017-07-25T16:40:07-0800",
"end_time": "2017-07-25T16:40:20-0800",
"elapsed_seconds": 13,
"elapsed_seconds_fmt": "13s",
"state": "finished",
"docs_indexed": 3,
"depth": 0,
"errors": 0,
"lines": [
"07/25 16:40:20 PST End Time: 07/25/2017 16:40:20 PST",
"07/25 16:40:20 PST Elapsed Time: 13 seconds",
"07/25 16:40:20 PST Pages Crawled: 3 pages",
"07/25 16:40:20 PST Pages Indexed: 3 pages",
"07/25 16:40:20 PST Words/Bytes Indexed: 2373 words/ 20618 bytes",
"07/25 16:40:20 PST Errors: 0",
"07/25 16:40:20 PST *** Index Summary ***",
"07/25 16:40:20 PST Total Pages: 3",
"07/25 16:40:20 PST --------------------------------------------------------------------",
"07/25 16:40:20 PST ======== Finish manual crawl of account sp99999999: Done. ========"
],
"status": 1,
"message": "ok"
}
Notez qu’aucune valeur offset
n’est renvoyée ici, car cette opération s’est terminée à la fin du fichier et qu’il n’y a plus de lignes à lire.
Chaque fois que votre site Web change, vous pouvez utiliser la télécommande pour exécuter un script ou un programme à partir de votre serveur, en demandant au robot de recherche d'exécuter un index.
Pour configurer le contrôle à distance pour l'indexation
Dans le menu produit, cliquez sur Index > Remote Control.
Sur la page Remote Control, définissez chaque option de champ de configuration pour pouvoir envoyer automatiquement une demande d'indexation de votre serveur afin d'indexer votre site Web.
Option |
Description |
---|---|
Mot de passe de contrôle à distance |
Indiquez le mot de passe de la télécommande. Les mots de passe sont sensibles à la casse (au moins six caractères) et doivent contenir au moins une lettre. Il est recommandé d’inclure également au moins un nombre. N’utilisez pas le mot de passe de connexion de recherche/marchandisage de votre site. Votre mot de passe est utilisé dans chaque demande de contrôle à distance. |
Chaîne de réponse OK |
Permet de spécifier une chaîne de texte de réponse OK si l’opération d’index demandée commence avec succès. Dans ce cas, le robot de recherche renvoie au serveur votre chaîne de réponse OK. |
Chaîne de réponse prioritaire |
Si une autre opération d'indexation est en cours lorsque la demande distante est effectuée, le robot de recherche ne peut pas exécuter l'index demandé. Dans ce cas, votre chaîne de texte de réponse Priorité est renvoyée au serveur. |
Chaîne de réponse d’erreur |
Permet de spécifier une chaîne de texte de réponse d’erreur Si votre mot de passe est incorrect ou si une autre erreur se produit. Dans ce cas, le robot de recherche renvoie à nouveau au serveur votre chaîne de réponse d’erreur. |
Cliquez sur Save Changes.