En savoir plus sur le Data Workbench Annonce de fin de vie.
Informations sur les paramètres spécifiques au web définis dans Jeu de données de traitement du journal Inclure les fichiers distribués avec des profils d’Adobe pour le site.
Le filtrage défini par ces paramètres se produit une fois que les entrées du journal ont quitté les décodeurs et que les transformations ont été appliquées, mais avant évaluation par Log Entry Condition.
Vous pouvez configurer votre mise en oeuvre de Site pour supprimer du jeu de données les entrées de journal dont le code sc-status est supérieur ou égal à 400. Les demandes réussies comportent des codes d’état inférieurs à 400. Votre mise en oeuvre par défaut comprend un Log Processing Dataset Include dans lequel le filtrage de l’état HTTP est configuré.
Modification des paramètres de configuration pour le filtrage de l’état HTTP
Ouvrez le Profile Manager dans votre profil de jeu de données et ouvrez la variable Dataset\Log Processing\Traffic\HTTP Status Filter.cfg fichier .
Si vous avez personnalisé votre implémentation de Site, le fichier dans lequel ces paramètres de configuration existent peut différer de l’emplacement décrit.
Vérifiez ou modifiez les valeurs des paramètres du fichier selon vos besoins. Utilisez l’exemple suivant comme guide.
Pour plus d’informations sur la variable Range condition, voir Conditions.
Enregistrez le HTTP Status Filter.cfg en cliquant avec le bouton droit de la souris (modified) en haut de la fenêtre et en cliquant sur Save.
Pour que les modifications apportées localement prennent effet, dans la variable Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la variable User , puis cliquez sur Save to > <profile name>, où nom du profil est le nom du profil du jeu de données ou du profil hérité auquel appartient le fichier d’inclusion du jeu de données.
N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.
Vous pouvez configurer votre mise en oeuvre de Site pour utiliser des fichiers de recherche afin de supprimer des entrées de journal générées par des robots connus, des scripts de test et des adresses IP pour les utilisateurs internes de votre jeu de données. Votre mise en oeuvre par défaut comprend un Log Processing Dataset Include fichier dans lequel le filtrage des robots est configuré.
Pour modifier les paramètres de configuration pour le filtrage robotique
Ouvrez le Profile Manager dans votre profil de jeu de données et ouvrez la variable Dataset\Log Processing\Traffic\Robot Filter.cfg fichier .
Si vous avez personnalisé votre implémentation de Site, le fichier dans lequel ces paramètres de configuration existent peut différer de l’emplacement décrit.
Vérifiez ou modifiez les paramètres du fichier à l’aide de l’exemple suivant et des informations sous forme de guides :
Le fichier comprend un NotRobotCondition qui est défini par les trois paramètres suivants :
Si l’agent utilisateur du navigateur d’une entrée de journal n’est répertorié dans aucun fichier de recherche, l’entrée de journal est considérée comme générée par un visiteur réel et n’est pas filtrée du jeu de données.
La correspondance dans les fichiers de recherche de robot utilise les sous-chaînes à comparer aux champs c-ip et cs(user-agent) log . Si la chaîne de recherche commence par "$", elle doit correspondre à l’avant de la chaîne en cours de test et si elle se termine par "$", la chaîne de recherche doit correspondre à la fin de la chaîne en cours de test. Si la chaîne de recherche commence par et se termine par "$", les chaînes doivent correspondre exactement pour que l’entrée du journal soit filtrée. Par exemple, pour tester toutes les adresses IP d’un bloc de classe C, utilisez une chaîne telle que $231.78.123. pour forcer une correspondance au début de la chaîne. Cela correspondrait aux adresses 231.78.123.0 à 231.78.123.255.
Enregistrez le fichier en cliquant avec le bouton droit de la souris (modified) en haut de la fenêtre et en cliquant sur Save.
Pour que les modifications apportées localement prennent effet, dans la variable Profile Manager, cliquez avec le bouton droit de la souris sur la coche du fichier dans la variable User , puis cliquez sur Save to > <profile name>, où nom du profil est le nom du profil du jeu de données ou du profil hérité auquel appartient le fichier d’inclusion du jeu de données.
N'enregistrez le fichier de configuration modifié dans aucun des profils internes fournis par Adobe, car vos modifications sont écrasées lorsque vous installez des mises à jour sur ces profils.
S’il est essentiel que les entrées de journal sous-jacentes utilisées pour construire un jeu de données ne changent pas (même si les transformations utilisées pour construire et mettre à jour le jeu de données et ses dimensions changent), le fichier de recherche robotique, la ligne de base et le fichier de recherche robotisé, étendu, doivent être contrôlés par version. En plaçant un numéro de version sur ces fichiers, vous avez la garantie que les mises à jour des fichiers de recherche de robot par défaut ne modifient pas involontairement les jeux de données de rapports construits précédemment en ajoutant ou en supprimant des entrées dans ces fichiers.