派生属性功能提供了一种从数据湖中提供的其他信息生成所选属性的便捷方法。 这些属性可以在任何常规频率下刷新,并可以选择性地发布到您的实时客户资料数据中。 派生属性可满足构建复杂属性(如十进制、百分位数和四分位数)的需要,而不是构建简单属性(如max、count和mean)。 这些属性可以专门针对单个用户或业务实体进行计算。 这样,您就可以派生可直接认证为标识符的属性,如电子邮件地址、设备ID和电话号码,还可以派生与该用户或业务配置文件间接关联的属性。
在数据湖上分析数据时,需要为各种用例提供派生属性。 然后,可以将此数据标记为在实时客户资料中使用,并用于下游用例,如创建高度集中的受众。 此功能的一些潜在用例可能包括:
要根据特定维度(类别)上的一个或多个量度(如收入、观看持续时间等)创建排名,需要复杂的派生属性。 使用派生属性对数据进行排名时,十分位数、四分位数和百分位数具有灵活性和精确度。
10是一种将一组排名数据拆分为10个相等部分的方法。 当数据被划分为十个文件时,会为数据集中的每一行分配一个十个级别。 这允许数据按降序或升序顺序排序。
10级按从低到高的顺序排列数据,并按1到10的比例进行,其中每个连续数都对应于增加10个百分点。
十个分类存储段表示排名组的数量,用于为数据集中的维度(类别)分配排名。 该存储段可以是一个数字或表达式,其计算结果为每个分区的正整数值。 存储段不得具有空值。
四分位数用于将分布除以四,百分位数除以100。
查询服务提供内置功能,例如会话化和最近联系等,您可以将这些功能应用于任何时间序列数据以生成与业务相关的派生属性。 您可以选择根据一个或多个身份确定这些分析派生属性,并根据需要选择将数据发布到实时客户资料。
此类派生属性的一些潜在用例可能包括:
您还可以将业务量度计算为派生属性,并将其与简单属性(如邮政编码)或汇总量度(如总计数)结合使用。 例如,基于城市或省份的总计数,或基于业务类别和城市/省份的总计数。
通过阅读本文档,您可以更好地了解查询服务派生属性如何促进复杂用例,从而最大限度地提高数据的效用。 接下来,您应该阅读 基于decile的派生属性用例 以了解如何在真实场景中应用此功能。