Référence d’indexation

<script src=“https://gist.github.com/dominique-pfister/92cb67b6f95e1edee6a7d6508b124039.js”></script>

La variable include et exclude détermine les documents qui sont indexés. Tout ce qui est inclus mais non exclu est indexé. Le double astérisque ** correspond à tout ce qui se trouve sous un préfixe, inclusion le préfixe, donc dans l’exemple ci-dessus, le chemin d’accès /documents est également indexé. Si vous omettez complètement cette section, tout est indexé.

La variable select est un sélecteur CSS qui extrait des éléments de HTML de votre document. L’indexeur applique vos sélecteurs sur le balisage de HTML et non sur le dom rendu. Vous devez donc les écrire en conséquence. (clic droit -> Afficher la source de page, sur la page à partir de laquelle vous souhaitez extraire des informations, pour voir le HTML exact de fonctionnement de l’indexeur).

Pour vérifier qu’un sélecteur CSS saisi sélectionne ce que vous attendez, vous pouvez utiliser la variable aem cli - aem up -–print-index, accédez à la page où le sélecteur doit extraire une valeur significative et vérifiez la console. L’interface de ligne de commande utilisera la variable helix-query.yaml à partir de votre système de fichiers local et imprime les valeurs extraites, ou une chaîne vide s’il ne parvient pas à trouver les informations qu’il recherche.

aem up --print-index
...
info: Index information for /my/test/page
info: Index: mysite
info:            author: "John Smith"

Notez que tous les sélecteurs CSS ne sont pas pris en charge. En interne, nous utilisons une bibliothèque appelée hast-util-selectet la liste des sélecteurs pris en charge se trouve ici : https://github.com/syntax-tree/hast-util-select#support

La variable value ou values contient une expression à appliquer à tous les éléments de HTML sélectionnés. Nom de la propriété value est préférable lorsque vous avez besoin d’une chaîne, values d’autre part, vous fournit un tableau de toutes les correspondances trouvées. L’expression peut contenir une combinaison de fonctions et de variables :

innerHTML(el)

Renvoie le contenu HTML d’un élément.

textContent(el)

Renvoie le contenu texte de l’élément sélectionné, ainsi que tous ses descendants.

attribute(el, name)

Renvoie la valeur de l’attribut avec le nom spécifié d’un élément.

match(el, re)

Correspond à une expression régulière contenant des parenthèses pour capturer des éléments dans l’élément transmis. Dans l’exemple d’auteur ci-dessus, le contenu réel de la variable <p> élément sélectionné peut contenir by John Smith, afin de capturer tout ce qui suit : by .

words(el, start, end)

Utile pour les teasers, cette option sélectionne une gamme de mots parmi un élément de HTML.

replace(el, substr, newSubstr)

Remplace la première occurrence d’une sous-chaîne dans un texte par une occurrence de remplacement.

replaceAll(el, substr, newSubstr)

Remplace toutes les occurrences d’une sous-chaîne dans un texte par une occurrence de remplacement.

parseTimestamp(el, format)

Analyse un horodatage donné sous forme de chaîne dans une format personnalisé, et renvoie sa valeur en tant que nombre de secondes depuis le 1er janvier 1970.

dateValue(el, format)

Analyse un horodatage donné en tant que chaîne et renvoie sa valeur en tant que numéro de série, où le 1er janvier 1900 correspond au numéro de série 1. Pour plus d’informations, voir fonction DATEVALUE

el

Renvoie les éléments de HTML sélectionnés par le select .

path

Renvoie le chemin d’accès du document de HTML en cours d’indexation.

headers[name]

Renvoie la valeur de l’en-tête de réponse HTTP avec le nom spécifié, au moment de la récupération du document de HTML.

1 La définition complète de la variable helix-query.yaml est disponible ici : https://github.com/adobe/helix-shared/blob/main/docs/indexconfig.md

recommendation-more-help
10a6ce9d-c5c5-48d9-8ce1-9797d2f0f3ec