了解和配置机器人规则

机器人规则允许您从由已知蜘蛛程序和机器人生成的报表包中删除流量。删除机器人流量可更准确地衡量您网站上的用户活动。

定义机器人规则之后,所有传入的流量会与定义的规则进行比较。报告包中不会收集符合这些规则的流量,并且不会包括在流量量度中。

删除机器人程序流量通常会减少流量和转化量度。许多客户发现,删除机器人流量会导致转化率提高,并导致其他可用性量度增加。

机器人流量数据存储在单独的存储库中,以便在机器人和机器人页面报表中显示。

NOTE
Adobe Experience Platform边缘网络提供 机器人检测服务 哪些标签标识为来自机器人的点击。 Adobe Analytics中使用的机器人检测过程是单独的,不会引用通过边缘网络到达的数据上包含的机器人分数。 但是,两个系统使用相同的IAB机器人列表。

更新或上传机器人规则

IMPORTANT
在删除机器人程序流量之前,请与利益关系人进行交流以确保做出此更改后他们会对关键性能指标做出必要的调整。如有可能,我们建议您首先从小型报表包中删除机器人程序流量以评估潜在的影响。

以下视频演示了如何配置机器人规则:

要更新或上载机器人规则,请执行以下操作:

  1. 转到 分析 > 管理员 > 报表包.

  2. 选择要更新机器人规则的报表包,然后选择 编辑设置 > 常规 > 机器人规则.

  3. 使用以下任意选项更新或上传报表包的机器人规则:

    • 选择 启用IAB机器人过滤规则 删除IAB(国际广告局)的国际蜘蛛程序与机器人列表中的机器人,从而删除机器人流量。

      我们建议您至少选择此选项。

      有关更多信息,请参阅以下部分, 标准IAB机器人规则.

    • 选择 添加规则 根据用户代理、IP地址或IP范围定义和添加自定义机器人规则。

      有关更多信息,请参阅以下部分, 自定义机器人规则.

    • 选择要导入的CSV机器人文件 区域,选择 选择文件,然后选择用于定义机器人规则的CSV文件。

      有关更多信息,请参阅以下部分, 上载机器人规则.

  4. 选择​ 保存

标准 IAB 机器人规则

可以通过选中启用 IAB 机器人过滤规则复选框来打开标准 IAB 机器人规则。此选择将删除 IAB(国际广告局)的国际蜘蛛程序与机器人列表中的机器人,从而删除机器人流量。Adobe 每月从 IAB 更新此列表。

Adobe 无法向客户提供详细的 IAB 机器人程序列表,但是您可以使用“机器人报表”来查看访问您网站的机器人程序的列表。要将机器人提交至 IAB 列表,请访问 IAB

有关如何启用报表包中标准IAB机器人规则的信息,请参阅 更新或上传机器人规则.

自定义机器人规则

NOTE
用户界面允许手动定义 500 个规则。在达到此限制后,必须通过“导入文件”和“导出机器人规则”选项对规则进行批量管理。

自定义机器人规则允许您根据定义的条件过滤流量。 要在报表包中开始启用自定义机器人规则的过程,请参阅 更新或上传机器人规则.

可使用以下条件类型定义自定义机器人规则:

  • 用户代理
  • IP 地址
  • IP 范围

单个规则可定义多个条件。多个条件可使用“OR”进行匹配。例如,如果您提供“用户代理”和“IP 地址”的值,则满足任一条件时,该流量将被视为机器人程序流量。

用户代理

用户代理条件会检查用户代理值以确定它是以指定的字符串​ 开头 ​还是​ 包含 ​指定的字符串。如果选择​ 包含,则在用户代理中出现该字符串时将会匹配子字符串。

不包含 ​列表中可包含可选值,以定义用户代理进行成功匹配不得包含的值。通过在每行包含一个值,可指定多个值。如果用户代理满足在匹配字符串中指定的标准,但同时包含“不包含”列表中的字符串,则可将其视为匹配。

包含 ​字段限制为 100 个字符。“不包含”列表限制为 255 个字符,在减去每个新行中的一个分隔符(分隔符数等于字符串的数量减 1。如果您指定 4 个​ 不包含 ​字符串,则需要 3 个分隔符)。所有字符串匹配区分大小写。

IP 地址(包含通配符匹配)

使用通配符 (*) 在同一代码块中匹配一个或多个 IP 地址。提供您要匹配的 IP 地址的数值。使用通配符替代要匹配的任何值的 *。以下列表包含 IP 地址匹配字符串的示例:

10.10.10.1
10.10.10.*

IP 地址范围

提供要匹配的 IP 地址的起始和终止范围。使用通配符替代要匹配的任何值的 *。

定义自定义机器人规则

  1. 转到 Analytics > 管理员,选择一个或多个报表包并单击​ 常规 > 机器人规则
  2. 单击​ 添加规则 ​并定义一个或多个匹配条件。
  3. 单击​ 保存。此更改应在 30 分钟内生效。

上载机器人规则

若要批量导入机器人规则,您可以上载定义规则的 CSV 文件。

  1. 要开始将机器人规则上传到报表包的过程,请参阅 更新或上传机器人规则.

  2. 创建一个CSV文件,该文件在电子表格的第1行中具有以下列,并且按照显示的顺序:

    table 0-row-6 1-row-6
    列1,行1 列2,行1 列3,行1 列4,行1 列5,行1 列6,行1
    机器人名称 IP开始 终止 IP 规则
    (包含或开头为)
    用户代理包括 用户代理排除
    (255个字符限制)

    您可以定义三种类型的机器人规则:

    • 用户代理包含或开头
    • 单个 IP 地址或通配符匹配
    • IP 范围匹配

    导入文件中的每行都可以包含唯一一个下列机器人定义:

    note note
    NOTE
    若要使用通过 OR 连接的规则组合(例如,用户代理或 IP 地址)与机器人进行匹配,请在机器人名称字段中为所有要组合的规则提供相同的名称。不支持 AND 匹配。
    • 用户代理包含或开头:提供单个用户代理字符串与“代理包含”列中的内容进行匹配。通过在“代理匹配规则”字段中置入​ 包含 ​或​ 开头,指定您想要执行的匹配类型。“代理排除”列中可包含可选值,该可选值可定义“代理”不包含的一个或多个用竖线分隔 ( | ) 的字符串。字符串匹配区分大小写。“起始 IP”和“终止 IP”列都必须为空。

    • 单个 IP 地址或通配符匹配:要匹配单个 IP 地址 (10.10.10.1) 或通配符 IP 地址 (10.10.*.*),请在“起始 IP”和“终止 IP”列中放置相同的值。“匹配规则”、“代理包含”和“代理排除”都必须为空。

    • IP 范围匹配:使用“起始 IP”和“终止 IP”列来定义 IP 地址的范围。可使用通配符来匹配 IP 范围,例如 10.10.10.*10.10.20.*。“匹配规则”、“代理包含”和“代理排除”都必须为空。

  3. 在报表包管理器的“机器人规则”页面上,单击 选择要导入的CSV机器人文件 区域,选择 选择文件,然后选择用于定义要导入的机器人规则的CSV文件。

  4. (可选)选择 覆盖现有规则 复选框,用于删除所有现有规则并使用上载文件中定义的规则替换它们。

  5. 选择 导入文件.

  6. 规则集 区域,查看导入的规则。

  7. 选择​ 保存

导出机器人规则

要将用户界面中定义的所有规则导出为CSV格式,请执行以下操作:

  1. 转到 分析 > 管理员 > 报表包.

  2. 选择包含要导出的机器人规则的报表包,然后选择 编辑设置 > 常规 > 机器人规则.

  3. 选择 导出机器人规则,然后将CSV文件保存到您的文件系统。

机器人规则对数据收集的影响 section_F01A3130E7A04A9993371CF26F6586F2

机器人规则可应用到所有分析数据。机器人规则删除的数据仅在“机器人”和“机器人页面”报表中可见。

先应用机器人规则,然后应用 VISTA 规则。请参阅《技术说明用户指南》中的处理顺序

高点击访问处理: ​如果一次访问中出现 100 次以上的点击,则报表会确定访问时间(以秒为单位)是否小于或等于访问的点击次数。在这种情况下,由于长时间集中访问的处理成本原因,报表会重新开始一个新访问。高点击访问通常是由机器人攻击造成的,因此不视为正常的访客浏览。

NOTE
标记为 bots 的点击将计为服务器调用。

IP 模糊处理对机器人过滤的影响 section_92E60B95BE8940D983F28C79E0CD6B12

IAB 机器人列表完全基于用户代理,因此基于该列表的过滤不受 IP 模糊设置影响。对于非 IAB 机器人过滤(自定义规则),IP 可能为过滤标准的一部分。如果过滤机器人使用 IP,则在启用该设置的情况下,机器人过滤发生于最后八位字节已被删除之后,但又在其他 IP 模糊处理选项之前,例如删除整个 IP 或将它替换为某些唯一 ID。

如果启用了 IP 模糊处理,则在 IP 地址被模糊处理之前会发生 IP 排除,这样客户就无需在启用 IP 模糊处理时更改任何内容。

如果删除了最后八位字节,则该操作是在 IP 过滤之前完成的。这样,最后八位字节将被替换为 0,并且应当更新 IP 排除规则以匹配末尾为 0 的 IP 地址。匹配 * 应匹配 0。

recommendation-more-help
2969e653-1f9b-4947-8b90-367efb66d529