Customer AI中的输入和输出
以下文档概述了Customer AI中使用的不同必需事件、输入和输出。
快速入门 getting-started
以下是构建倾向模型和识别目标受众以在Customer AI中进行个性化营销的步骤:
-
概述用例:倾向模型如何帮助确定个性化营销的目标受众? 我的业务目标和实现该目标的相应策略是什么? 倾向建模在此过程中处于什么地位?
-
排定用例优先级:哪一项是业务的最高优先级?
-
根据这些区段采取有针对性的业务行动。 监控结果并反复执行要改进的操作。
以下是第一个模型的配置示例。 本文档中构建的示例模型使用客户人工智能模型来预测谁可能在未来30天内转投零售业务。 输入数据集是Adobe Analytics数据集。
模型类型:转换
标识:确保将每个数据集的标识列设置为公共标识。
commerce.purchases.value
等于铅笔结果窗口: 30天。
为配置文件 启用:必须为要用于分段中的模型输出启用此项。
数据概述 data-overview
以下部分概述了客户人工智能中使用的各种所需事件、输入和输出。
客户人工智能通过分析以下数据集来预测客户流失(客户何时可能停止使用产品)或转化(客户何时可能购买)倾向分数:
- 使用Analytics源连接器的Adobe Analytics数据
- 使用Audience Manager源连接器的Adobe Audience Manager数据
- 体验事件数据集
- 使用者体验事件数据集
如果每个数据集共享相同的身份类型(命名空间)(如ECID),则可以添加来自不同来源的多个数据集。 有关添加多个数据集的更多信息,请访问客户人工智能用户指南。
下表概述了本文档中使用的一些常用术语:
Experience Event
的数据。 架构的数据行为由架构的类定义,该类在首次创建架构时分配给架构。 XDM类描述架构必须包含的最小属性数,以便表示特定数据行为。meta:intendedToExtend
属性标识的特定类兼容。客户人工智能输入数据 customer-ai-input-data
对于输入数据集(如Adobe Analytics和Adobe Audience Manager),默认情况下,源连接器在连接过程中直接映射这些标准字段组(Commerce、Web、应用程序和搜索)中的事件。 下表显示了Customer AI的默认标准字段组中的事件字段。
有关映射Adobe Analytics数据或Audience Manager数据的详细信息,请访问Analytics字段映射或Audience Manager字段映射指南。
您可以将体验事件或使用者体验事件XDM架构用于未通过以上连接器之一填充的输入数据集。 可在架构创建过程中添加其他XDM字段组。 字段组可由标准字段组或自定义字段组等Adobe提供,这与平台中的数据表示形式匹配。
客户人工智能使用的标准字段组 standard-events
体验事件用于确定各种客户行为。 根据数据的结构方式,下面列出的事件类型可能不会包含客户的所有行为。 由您来决定哪些字段具有必要的数据,该数据是清晰明确地识别Web或其他特定于渠道的用户活动所必需的。 根据您的预测目标,所需的必填字段可能会发生更改。
默认情况下,客户人工智能使用四个标准字段组中的事件:Commerce、Web、Application和Search。 无需在下面列出的标准字段组中为每个事件提供数据,但在某些情况下需要某些事件。 如果标准字段组中有任何可用事件,建议将其包含在架构中。 例如,如果要创建用于预测购买事件的客户人工智能模型,则从Commerce和网页详细信息字段组获得数据会很有用。
要在Platform UI中查看字段组,请选择左边栏上的 架构 选项卡,然后选择 字段组 选项卡。
-
commerce.order.purchaseID
-
productListItems.SKU
-
commerce.productListViews.value
-
productListItems.SKU
-
commerce.checkouts.value
-
productListItems.SKU
-
commerce.purchases.value
-
productListItems.SKU
-
commerce.productListRemovals.value
-
productListItems.SKU
-
commerce.productListOpens.value
-
productListItems.SKU
-
commerce.productViews.value
-
productListItems.SKU
web.webPageDetails.name
web.webInteraction.linkClicks.value
-
application.applicationCloses.value
-
application.name
-
application.crashes.value
-
application.name
-
application.featureUsages.value
-
application.name
-
application.firstLaunches.value
-
application.name
-
application.installs.value
-
application.name
-
application.launches.value
-
application.name
-
application.upgrades.value
-
application.name
search.keywords
此外,Customer AI可以使用订阅数据构建更好的流失模型。 使用订阅数据类型格式的每个配置文件都需要订阅数据。 大多数字段是可选的,但是,对于最佳流失模型,强烈建议您为尽可能多的字段(如startDate
、endDate
)提供数据,以及任何其他相关详细信息。 请联系您的帐户团队以获取有关此功能的更多支持。
添加自定义事件和配置文件属性 add-custom-events
如果除了客户人工智能使用的默认标准事件字段之外,您还希望包含其他信息,则可以使用自定义事件配置来增加模型使用的数据。
何时使用自定义事件
当在数据集选择步骤中选择的数据集包含 none 客户人工智能使用的默认事件字段时,需要自定义事件。 客户人工智能需要有关结果以外的至少一个用户行为事件的信息。
自定义事件有助于:
-
将领域知识或先前的专业知识纳入模型。
-
提高预测模型质量。
-
获得更多见解和解释。
自定义事件的最佳候选者是包含可以预测结果的域知识的数据。 自定义事件的一些常规示例包括:
-
注册帐户
-
订阅新闻稿
-
致电客户服务
以下是一些特定于行业的自定义事件示例:
注册会员卡
剪辑移动优惠券。
流视频。
购买会员积分。
要选择自定义事件,必须表示用户启动的操作。 例如,“电子邮件发送”是由营销人员而不是用户启动的操作,因此不应将其用作自定义事件。
历史数据
客户人工智能需要历史数据来进行模型训练。 数据在系统中存在的所需持续时间由两个关键因素决定:结果窗口和合格群体。
默认情况下,如果在应用程序配置期间未提供符合条件的群体定义,客户人工智能会查找最近45天内有活动的用户。 此外,根据预测的目标定义,客户人工智能要求来自历史数据的至少500个符合条件事件和500个非符合条件事件(总共1000个)。
以下示例演示了如何使用一个简单的公式,该公式可帮助您确定所需的最小数据量。 如果您拥有的数据多于最低要求,则您的模型可能会提供更准确的结果。 如果少于所需的最小值,则模型将失败,因为没有足够的数据进行模型训练。
客户人工智能使用生存模型来估计在给定时间发生事件的概率,并识别影响因素,同时使用定义正和负群体的监督学习和lightgbm
之类的决策树来生成概率分数。
公式:
要确定系统中现有数据所需的最短持续时间,请执行以下操作:
-
创建功能所需的最少数据为30天。 将资格回顾时间范围与30天进行比较:
-
如果资格回顾窗口大于30天,则数据要求=资格回顾窗口+结果窗口。
-
否则,数据要求= 30天+结果窗口。
-
**如果定义合格群体的条件不止一个,则合格回顾时间范围为最长。
示例:
-
您想要预测客户是否可能在接下来的30天内为过去60天内有某个Web活动的客户购买手表。
-
资格回顾时间范围= 60天
-
结果窗口= 30天
-
所需数据= 60天+ 30天= 90天
-
-
您想要预测用户是否可能在 后7天内购买手表而不提供明确的合格群体。 在这种情况下,符合条件的群体将默认为“过去45天内有活动的人”,并且结果窗口为7天。
-
资格回顾时间范围= 45天
-
结果窗口= 7天
-
所需数据= 45天+ 7天= 52天
-
-
您想要预测客户是否可能在未来7天内为过去7天内进行某些Web活动的客户购买手表。
-
资格回顾时间范围= 7天
-
创建功能所需的最小数据= 30天
-
结果窗口= 7天
-
所需数据= 30天+ 7天= 37天
-
尽管客户人工智能要求数据在系统中存在最短时间,但它也最适用于最近的数据。 通过使用最新的行为数据,客户人工智能有可能对用户未来的行为产生更准确的预测。
Customer AI输出数据 customer-ai-output-data
客户人工智能为被认为符合条件的个人资料生成多个属性。 根据您配置的内容,可通过两种方式使用得分(输出)。 如果您拥有启用实时客户配置文件的数据集,则可以在区段生成器中使用来自实时客户配置文件的见解。 如果您没有启用配置文件的数据集,您可以下载可在数据湖中使用的客户人工智能输出数据集。
您可以在Platform 数据集 工作区中找到输出数据集。 所有客户人工智能输出数据集都以名称 客户人工智能分数 — NAME_OF_APP 开头。 同样,所有客户人工智能输出架构都以名称 客户人工智能架构 — Name_of_app 开头。
下表描述了在Customer AI输出中找到的各种属性:
这些是个人资料可能会发生转化或流失的预测原因。 这些因素由以下属性组成:
- 代码:对个人资料的预测得分产生积极影响的个人资料或行为属性。
- 值:配置文件或行为属性的值。
- 重要性:表示配置文件或行为属性对预测分数(低、中、高)的权重
后续步骤 next-steps
准备数据并确保所有凭据和架构均已就绪后,请参阅配置客户人工智能实例指南,该指南将指导您完成创建客户人工智能实例的分步教程。