Informations sur les paramètres spécifiques au web définis dans Jeu de données de traitement du journal Inclure les fichiers distribués avec des profils d’Adobe pour le site.
Le filtrage défini par ces paramètres se produit une fois que les entrées du journal ont quitté les décodeurs et que les transformations sont appliquées, mais avant l’évaluation par la balise Log Entry Condition.
Vous pouvez configurer votre implémentation de Site pour supprimer les entrées de journal avec des codes sc-status de 400 ou plus du jeu de données. Les demandes réussies comportent des codes d’état inférieurs à 400. Votre mise en oeuvre par défaut comprend un fichier Log Processing Dataset Include dans lequel le filtrage de l’état HTTP est configuré.
Modification des paramètres de configuration pour le filtrage de l’état HTTP
Ouvrez le Profile Manager dans votre profil de jeu de données et ouvrez le fichier Dataset\Log Processing\Traffic\HTTP Status Filter.cfg.
Si vous avez personnalisé votre implémentation de Site, le fichier dans lequel ces paramètres de configuration existent peut différer de l’emplacement décrit.
Vérifiez ou modifiez les valeurs des paramètres du fichier selon vos besoins. Utilisez l’exemple suivant comme guide.
Pour plus d’informations sur la condition Range, voir Conditions.
Enregistrez le fichier HTTP Status Filter.cfg en cliquant avec le bouton droit de la souris sur (modified) en haut de la fenêtre, puis en cliquant sur Save.
Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la colonne User, puis cliquez sur Save to <profile name, où le nom du profil correspond au nom du profil du jeu de données ou au profil hérité auquel appartient le fichier d’inclusion du jeu de données.
N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.
Vous pouvez configurer votre implémentation de Site pour utiliser des fichiers de recherche afin de supprimer des entrées de journal générées par des robots connus, des scripts de test et des adresses IP pour les utilisateurs internes de votre jeu de données. Votre mise en oeuvre par défaut comprend un fichier Log Processing Dataset Include dans lequel le filtrage des robots est configuré.
Pour modifier les paramètres de configuration pour le filtrage robotique
Ouvrez le Profile Manager dans votre profil de jeu de données et ouvrez le fichier Dataset\Log Processing\Traffic\Robot Filter.cfg.
Si vous avez personnalisé votre implémentation de Site, le fichier dans lequel ces paramètres de configuration existent peut différer de l’emplacement décrit.
Vérifiez ou modifiez les paramètres du fichier à l’aide de l’exemple suivant et des informations sous forme de guides :
Le fichier comprend une balise NotRobotCondition définie par les trois paramètres suivants :
Si l’agent utilisateur du navigateur d’une entrée de journal n’est répertorié dans aucun fichier de recherche, l’entrée de journal est considérée comme générée par un visiteur réel et n’est pas filtrée du jeu de données.
La correspondance dans les fichiers de recherche de robot utilise les sous-chaînes à comparer aux champs c-ip et cs(user-agent) log . Si la chaîne de recherche commence par "$", elle doit correspondre à l’avant de la chaîne en cours de test et si elle se termine par "$", la chaîne de recherche doit correspondre à la fin de la chaîne en cours de test. Si la chaîne de recherche commence par et se termine par "$", les chaînes doivent correspondre exactement pour que l’entrée du journal soit filtrée. Par exemple, pour tester toutes les adresses IP d’un bloc de classe C, utilisez une chaîne telle que $231.78.123. pour forcer une correspondance au début de la chaîne. Cela correspondrait aux adresses 231.78.123.0 à 231.78.123.255.
Enregistrez le fichier en cliquant avec le bouton droit de la souris sur (modified) en haut de la fenêtre et en cliquant sur Save.
Pour que les modifications apportées localement prennent effet, dans la balise Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la colonne User, puis cliquez sur Save to <profile name, où le nom du profil correspond au nom du profil du jeu de données ou au profil hérité auquel appartient le fichier d’inclusion du jeu de données.
N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.
S’il est essentiel que les entrées de journal sous-jacentes utilisées pour construire un jeu de données ne changent pas (même si les transformations utilisées pour construire et mettre à jour le jeu de données et ses dimensions changent), le fichier de recherche robotique, la ligne de base et le fichier de recherche robotisé, étendu, doivent être contrôlés par version. En plaçant un numéro de version sur ces fichiers, vous avez la garantie que les mises à jour des fichiers de recherche de robot par défaut ne modifient pas involontairement les jeux de données de rapports construits précédemment en ajoutant ou en supprimant des entrées dans ces fichiers.