“长尾”维度项

如果使用包含大量唯一值的维度,有时可以在报告中看到一个标记为​长尾​的值。此维度项意味着 CJA 使用的报告体系结构包含太多唯一值,无法处理。

CJA 处理体系结构和唯一值

CJA 在运行报告时处理这些报告,将组合数据集分发到若干服务器上。每个处理服务器的数据按人员 ID 分组,这意味着单个处理服务器包含给定人员的所有数据。一旦完成处理,它会将其处理过的数据的子集传递给聚合器服务器。所有已处理数据的子集都以工作区报表的形式组合并返回。

如果任何处理数据子集的单个服务器遇到超过 500,000 个唯一维度项,它将返回其自己子集的前 500,000 个维度项,然后返回“长尾”下的其余维度项。在工作区报表中看到的“长尾”维度项是各处理服务器的值(超过 500,000 个唯一值)的总和。

“长尾”与“低流量”之间的区别

在早期版本的 Analytics 中,使用了不同的处理体系结构。在收集数据时就对数据进行了处理。在维度达到 500,000 个唯一值后将维度项置于“低流量”下,并在达到 1,000,000 个唯一值时应用更激进的过滤。在每个日历月的月初重置唯一值计数。处理过的数据是永久性的;没有办法从“低流量”中获取现有数据。

在 CJA 中,仅当单个处理服务器包含超过 500,000 个唯一值时,才会将维度项放入“长尾”中。处理过的数据不是永久性的,这意味着您可以通过修改报表来减少“长尾”维度项。

减少“长尾”维度项

如果您想减少“长尾”维度项,Adobe 建议执行以下任一操作:

  • 使用过滤器。在每台服务器处理数据子集时应用过滤器。限制它们返回的唯一值的数量会减少“长尾”维度项。
  • 使用查找数据集维度。查找数据集维度将事件数据集维度项组合在一起,从而限制返回的唯一值的数量。

总的来说,很难使用包含超过 500,000 个唯一维度项的报表。如果应用过滤器或查找数据集维度,可以减少“长尾”的存在,同时使报表更易于使用。Adobe 计划随着 CJA 的进一步发展来改善这种体验。

在此页面上