派生属性

派生属性功能提供了一种从数据湖中提供的其他信息生成所选属性的便捷方法。 这些属性可以在任何常规频率下刷新,并可以选择性地发布到您的实时客户资料数据中。 派生属性可满足构建复杂属性(如十进制、百分位数和四分位数)的需要,而不是构建简单属性(如max、count和mean)。 这些属性可以专门针对单个用户或业务实体进行计算。 这样,您就可以派生可直接认证为标识符的属性,如电子邮件地址、设备ID和电话号码,还可以派生与该用户或业务配置文件间接关联的属性。

在数据湖上分析数据时,需要为各种用例提供派生属性。 然后,可以将此数据标记为在实时客户资料中使用,并用于下游用例,如创建高度集中的受众。 此功能的一些潜在用例可能包括:

  • 根据按频道的收视量确定最低10%的订阅者。 这将允许营销人员定位特定受众并销售新订阅者包。
  • 根据旅行里程总数确定在前10%的传单中具有“传单”状态的受众。 此受众可用于有选择地定位新信用卡选件的销售。
  • 根据订阅确定流失率。
  • 确定省或州家庭收入中收入最高的1%,并提供一项指标,以衡量过去“n”个月中从该集体群体中移出的个人数量。

复杂的派生属性

要根据特定维度(类别)上的一个或多个量度(如收入、观看持续时间等)创建排名,需要复杂的派生属性。 使用派生属性对数据进行排名时,十分位数、四分位数和百分位数具有灵活性和精确度。

10是一种将一组排名数据拆分为10个相等部分的方法。 当数据被划分为十个文件时,会为数据集中的每一行分配一个十个级别。 这允许数据按降序或升序顺序排序。

10级按从低到高的顺序排列数据,并按1到10的比例进行,其中每个连续数都对应于增加10个百分点。

十个分类存储段表示排名组的数量,用于为数据集中的维度(类别)分配排名。 该存储段可以是一个数字或表达式,其计算结果为每个分区的正整数值。 存储段不得具有空值。

四分位数用于将分布除以四,百分位数除以100。

分析派生属性

查询服务提供内置功能,例如会话化和最近联系等,您可以将这些功能应用于任何时间序列数据以生成与业务相关的派生属性。 您可以选择根据一个或多个身份确定这些分析派生属性,并根据需要选择将数据发布到实时客户资料。

此类派生属性的一些潜在用例可能包括:

  • 跟踪在用户会话期间扫描的无现货产品。
  • 跟踪常用量度,如所浏览或购买产品的大小、颜色或产品类别。
  • 跟踪导致产品浏览或购买的平台源。
  • 通过身份跟踪最近浏览的项目。
  • 跟踪量度,例如购物车中的平均项目数、购物车放弃或平均购买频率。

其他派生属性

您还可以将业务量度计算为派生属性,并将其与简单属性(如邮政编码)或汇总量度(如总计数)结合使用。 例如,基于城市或省份的总计数,或基于业务类别和城市/省份的总计数。

后续步骤和用例

通过阅读本文档,您可以更好地了解查询服务派生属性如何促进复杂用例,从而最大限度地提高数据的效用。 接下来,您应该阅读 基于decile的派生属性用例 以了解如何在真实场景中应用此功能。

在此页面上