个性化优化模型 personalized-optimization-model
概述 overview
通过利用机器学习和深度学习中的先进技术,个性化优化可让业务用户(营销人员)定义业务目标,并利用其客户数据培训面向业务的模型,以提供个性化优惠并最大化KPI。
主要模型假设和限制 key
为了最大化使用个性化优化的优势,需要注意一些关键的假设和限制。
- 优惠足够不同,因此用户所考虑的优惠之间会有不同的偏好。 如果选件过于相似,则生成的模型产生的影响会较小,因为响应似乎是随机的。
例如,如果一家银行有两张信用卡选件,唯一的区别是颜色,那么推荐使用哪张卡可能无关紧要,但如果每张卡使用的术语不同,这就解释了为什么某些客户会选择一张,并提供了足够的不同选件差异来构建更具影响力的模型。 - 用户流量构成稳定。 如果在模型训练和预测过程中用户流量组成发生剧烈变化,模型性能就会下降。 例如,假设在模型训练阶段,只有受众A中的用户数据可用,但已训练模型用于生成受众B中的用户的预测,那么模型性能可能会受到影响。
- 选件性能在短时间内不会发生显着变化,因为该模型每周都会更新,并且性能更改会在模型更新时传递。 例如,一种产品以前很流行,但是一份公开报告指出这种产品对我们的健康有害,而且这种产品很快就变得不受欢迎。 在此场景中,模型可以继续预测该产品,直到模型随着用户行为的变化而更新。
工作原理 how
该模型利用优惠信息、用户信息和情境信息之间的复杂特征交互,向最终用户推荐个性化优惠。 特征是模型的输入。
有3种功能:
该模型分为两个阶段:
- 在 离线模型训练 阶段,通过学习和记忆历史数据中的特征交互来训练模型。
- 在 在线推断 阶段,根据模型生成的实时得分对候选优惠进行排名。 个性化优化是一种基于深度学习的推荐方法,能够包含和学习复杂的、非线性的特征交互模式,而传统的协同过滤技术很难包含用户和选件。
下面是一个简化的示例,用于说明个性化优化背后的基本思想。 假设我们有一个数据集,用于存储用户和选件之间的历史交互,如图1所示。 有:
- 两个选件,offer_1和offer_2,
- 两个特征,feature_1和feature_2,
- 响应列。
feature_1、feature_2和response的值为0或1。 查看图1中的蓝色框和橙色框时,我们可以发现,对于offer_1,当feature_1和feature_2具有相同的值时,响应更有可能为1;而对于offer_2,当feature_1为0和feature_2为1时,标签更有可能为1。 我们还可以在红色框中看到,当feature_1为0、feature_2为1、response为0时,将会提供offer_1。 根据我们在橙色框中看到的模式,当feature_1为0且feature_2为1时,offer_2可能是更好的推荐。
基本上,这是学习和记忆历史特征交互并运用它们来产生个性化的预测。
冷启动问题 cold-start
当没有足够的数据进行推荐时,会发生冷启动问题。 对于个性化优化,冷启动问题有两种类型。
- 创建没有历史数据的新AI模型后,选件将随机提供一段时间以收集数据,并且数据将用于训练第一个模型。
- 在发布第一个模型后,总流量的10%将分配给随机服务,而90%的流量将用于模型推荐。 因此,如果向AI模型添加新选件,则这些选件将作为10%的流量的一部分提供。 随着模型的不断更新,针对这些选件收集的数据将决定从90%的流量中选择该选件的次数。
重新培训 re-training
模型将接受重新培训,以学习最新的功能交互,并每周缓解模型性能下降。