高基数维度

使用包含许多唯一值的维度时,生成的报表可能包含太多要显示或计算的唯一维度项。 通过删除被认为最不重要的维度项目,截断结果。 这些优化是为了保持项目和产品性能。

当您请求具有过多唯一值的报表时,Analysis Workspace会在维度标题中显示一个指示器,以说明并未包含所有维度项。 例如,行:超过22,343,156 ​的1-50。 大于 ​关键字表示已对报表应用了一些优化,以返回最重要的维度项。

Workspace中的自由格式表显示“大于”关键字,可显示1-50个大于22,343,156

确定要显示的维度项目

Customer Journey Analytics在运行报表时对其进行处理,将组合数据集分发到多台服务器。 每个处理服务器的数据按人员ID分组,这意味着单个处理服务器包含给定人员的所有数据。 一旦服务器完成处理,它就会将其处理过的数据的子集交给聚合器服务器。 所有已处理数据的子集都以工作区报表的形式组合并返回。

如果任何单个服务器处理的数据超过唯一阈值,它将先截断结果,然后再返回已处理的数据子集。 已截断的维度项目是根据用于排序的量度确定的。

如果排序量度是计算量度,则服务器使用计算量度中的量度来确定要截断的维度项目。 由于计算量度可以包含多个具有不同重要性的量度,因此结果的准确性可能会降低。 例如,在计算“每人收入”时,会返回总收入金额和人数,并在进行分配前进行汇总。 因此,每个单独的处理服务器都会选择删除哪些项目,而不知道它们的结果如何影响整体排序。

尽管高基数报表中可能缺少某些个别维度项,但列总数是准确的,且并非基于截断的数据。 计算量度中的“非重复计数”函数也不受截断的维度项目的影响。

高基数维度的最佳实践

适应高基数维度的最佳方法是限制报表处理的维度项目数。 由于所有报表在请求时都会进行处理,因此您可以调整报表参数以即时获得结果。 Adobe建议对高基数维度进行以下任何优化:

  • 使用筛选器。 过滤器在每个服务器处理数据子集时应用。
  • 使用搜索。 从搜索词中排除的Dimension项目将从报表结果中删除,这样您更有可能看到所需的维度项目。
  • 使用查找数据集维度。查找数据集维度将事件数据集维度项组合在一起,从而限制返回的唯一值的数量。
  • 在数据视图管理器中使用包含/排除组件设置。
  • 缩短请求的日期范围。 如果许多唯一值随时间累积,则缩短Workspace报表的日期范围可以限制要处理的服务器唯一值的数量。
  • 考虑使用完全表导出返回表的所有行。
recommendation-more-help
080e5213-7aa2-40d6-9dba-18945e892f79