了解和配置机器人规则

机器人规则允许您从由已知蜘蛛程序和机器人生成的报表包中删除流量。删除机器人流量可更准确地衡量您网站上的用户活动。

定义机器人规则之后,所有传入的流量会与定义的规则进行比较。报告包中不会收集符合这些规则的流量,并且不会包括在流量量度中。

删除机器人流量通常会减少流量和转化量度。 许多客户发现,删除机器人流量会导致转化率提高,并导致其他可用性量度增加。

机器人流量数据存储在单独的存储库中,以便在机器人和机器人页面报表中显示。

NOTE
Adobe Experience Platform Edge Network提供机器人检测服务,该服务将识别为来自机器人的点击标记为机器人点击。 Adobe Analytics中使用的机器人检测过程是单独的,不会引用通过Edge Network到达的数据中包含的机器人分数。 但是,两个系统使用相同的IAB机器人列表。

更新或上传机器人规则

IMPORTANT
在删除机器人流量之前,请与利益相关者沟通,确保他们能够作为此更改的结果对关键绩效指标进行必要的调整。 如有可能,我们建议您首先从小型报表包中删除机器人程序流量以评估潜在的影响。
recommendation-more-help

请参阅 VideoCheckedOut 为演示视频配置机器人规则

要更新或上载机器人规则,请执行以下操作:

  1. 转到​Analytics > 管理员 > 报表包

  2. 选择要更新机器人规则的报表包,然后选择​编辑设置 > 常规 > 机器人规则

  3. 使用以下任意选项更新或上传报表包的机器人规则:

    • 选择​ 启用IAB机器人过滤规则 ​以删除IAB(国际Advertising局)的国际蜘蛛程序和机器人列表中的机器人,从而删除机器人流量。

      我们建议您至少选择此选项。

      有关详细信息,请参阅下面的标准IAB机器人规则部分。

    • 选择​ 添加规则 ​以根据用户代理、IP地址或IP范围定义和添加自定义机器人规则。

      有关详细信息,请参阅下面的部分,自定义机器人规则

    • 在​ 选择要导入的CSV机器人文件 ​区域旁边,选择​选择文件,然后选择用于定义机器人规则的CSV文件。

      有关详细信息,请参阅下面的上载机器人规则部分。

  4. 选择​保存

标准 IAB 机器人规则

可以通过选中启用 IAB 机器人过滤规则复选框来打开标准 IAB 机器人规则。此选择将删除 IAB(国际广告局)的国际蜘蛛程序与机器人列表中的机器人,从而删除机器人流量。Adobe 每月从 IAB 更新此列表。

Adobe 无法向客户提供详细的 IAB 机器人程序列表,但是您可以使用“机器人报表”来查看访问您网站的机器人程序的列表。要将机器人提交至 IAB 列表,请访问 IAB

有关如何启用报表包中标准IAB机器人规则的信息,请参阅更新或上载机器人规则

自定义机器人规则

NOTE
用户界面允许手动定义 500 个规则。在达到此限制后,必须通过“导入文件”和“导出机器人规则”选项对规则进行批量管理。

自定义机器人规则允许您根据定义的条件过滤流量。 要开始启用报表包中自定义机器人规则的过程,请参阅更新或上载机器人规则

使用以下条件类型定义自定义机器人规则:

  • 用户代理
  • IP 地址
  • IP范围

可以为单个规则定义多个条件。 使用“或”匹配多个条件。 例如,如果为用户代理和IP地址提供值,则在满足任一条件时,该流量将被视为机器人流量。

用户代理

用户代理条件会检查用户代理值以确定它是以指定的字符串​ 开头 ​还是​ 包含 ​指定的字符串。如果选择​包含,则在用户代理中出现该字符串时将会匹配子字符串。

不包含​列表中可包含可选值,以定义用户代理进行成功匹配不得包含的值。通过每行包含一个值,可以指定多个值。 如果用户代理满足匹配字符串中指定的条件,但在不包含列表中也包含字符串,则不会将其视为匹配项。

包含​字段限制为 100 个字符。不包含列表限制为255个字符减去每行一个分隔符。 (这等于字符串数 — 1。 如果指定4 不包含​字符串,则需要3个分隔符。) 所有字符串匹配均不区分大小写。

IP 地址(包含通配符匹配)

使用通配符 (*) 在同一代码块中匹配一个或多个 IP 地址。提供您要匹配的 IP 地址的数值。使用通配符替代要匹配的任何值的 *。以下列表包含 IP 地址匹配字符串的示例:

10.10.10.1
10.10.10.*

IP 地址范围

提供要匹配的 IP 地址的起始和终止范围。使用通配符替代要匹配的任何值的 *。

定义自定义机器人规则

  1. 转到 Analytics > 管理员,选择一个或多个报表包并单击​常规 > 机器人规则
  2. 单击​ 添加规则 ​并定义一个或多个匹配条件。
  3. 单击​保存。此更改应在 30 分钟内生效。

上载机器人规则

要批量导入机器人规则,您可以上传用于定义规则的CSV文件。

  1. 要开始将机器人规则上载到报表包的过程,请参阅更新或上载机器人规则

  2. 创建一个CSV文件,该文件在电子表格的第1行中具有以下列,并且按照显示的顺序:

    table 0-row-6 1-row-6
    列1,行1 列2,行1 列3,行1 列4,行1 列5,行1 列6,行1
    机器人名称 IP开始 终止 IP 规则
    (包含或开头为)
    用户代理包括 用户代理排除
    (255个字符限制)

    您可以定义三种类型的机器人规则:

    • 用户代理包含或开头为
    • 单个IP地址或通配符匹配
    • IP范围匹配

    导入文件中的每一行只能包含下列机器人定义之一:

    note note
    NOTE
    要使用与OR关联的规则组合(例如,用户代理或IP地址)匹配机器人,请在机器人名称字段中为要组合的所有规则提供相同的名称。 不支持AND匹配。
    • 用户代理包含或开头为:在“代理包含”列中提供一个要匹配的用户代理字符串。 通过在“代理匹配规则”字段中放置​ 包含 ​或​ 开头为 ​来指定您要执行的匹配类型。 “代理排除”列中可包含可选值,该可选值可定义“代理”不包含的一个或多个用竖线分隔 ( | ) 的字符串。字符串匹配不区分大小写。 “IP开始”和“IP结束”列都必须为空。

    • 单个 IP 地址或通配符匹配:要匹配单个 IP 地址 (10.10.10.1) 或通配符 IP 地址 (10.10.*.*),请在“起始 IP”和“终止 IP”列中放置相同的值。“匹配规则”、“代理包含”和“代理排除”都必须为空。

    • IP范围匹配:使用“IP开头”和“IP结尾”列定义IP地址范围。 可使用通配符来匹配 IP 范围,例如 10.10.10.*10.10.20.*。“匹配规则”、“代理包含”和“代理排除”都必须为空。

  3. 在报表包管理器的“机器人规则”页面的​ 选择要导入的CSV机器人文件 ​区域旁边,选择​选择文件,然后选择用于定义要导入的机器人规则的CSV文件。

  4. (可选)选中​ 覆盖现有规则 ​复选框可删除所有现有规则,并使用上载文件中定义的规则替换现有规则。

  5. 选择​导入文件

  6. 在​ 规则集 ​区域,查看导入的规则。

  7. 选择​保存

导出机器人规则

要将用户界面中定义的所有规则导出为CSV格式,请执行以下操作:

  1. 转到​Analytics > 管理员 > 报表包

  2. 选择包含要导出的机器人规则的报表包,然后选择​编辑设置 > 常规 > 机器人规则

  3. 选择​导出机器人规则,然后将CSV文件保存到您的文件系统。

机器人规则对数据收集的影响 section_F01A3130E7A04A9993371CF26F6586F2

机器人规则可应用到所有分析数据。机器人规则删除的数据仅在“机器人”和“机器人页面”报表中可见。

先应用机器人规则,然后应用 VISTA 规则。请参阅《技术说明用户指南》中的处理顺序

高点击访问处理:​如果一次访问中超过100次点击,报表将确定访问时间(以秒为单位)是否小于或等于访问中的点击数。 在这种情况下,由于处理时间长、访问量大的成本,报表将从新访问开始。 高点击访问通常由机器人攻击引起,不被视为正常访客浏览。

NOTE
标记为 bots 的点击将计为服务器调用。

IP 模糊处理对机器人过滤的影响 section_92E60B95BE8940D983F28C79E0CD6B12

IAB机器人列表仅基于用户代理,因此基于该列表的过滤不受IP模糊处理设置的影响。 对于非IAB机器人筛选(自定义规则),IP可能是筛选条件的一部分。 如果使用IP过滤机器人,则机器人过滤会在删除最后一个八位字节之后(如果已启用此设置),但在使用其他IP模糊处理选项(例如,删除整个IP或将其替换为某个唯一ID)之前进行。

如果启用了IP模糊处理,则在IP地址被模糊处理之前会进行IP排除,这样客户就无需在启用IP模糊处理时更改任何内容。

如果删除最后一个八位字节,则会在IP过滤之前完成。 这样,最后八位字节将被替换为 0,并且应当更新 IP 排除规则以匹配末尾为 0 的 IP 地址。匹配 * 应匹配 0。

2969e653-1f9b-4947-8b90-367efb66d529