按照以下步骤使用“倾向评分”可视化。
打开新工作区,然后单击Add > Visualization > Predictive Analytics > Scoring > Propensity Score。
设置Target(因变量)。
通过选择以下项设置因变量:
Dimension元素:在工作区中右键单击并选择 Table。然后选择一个维度元素作为您的因变量。
或者
Filter Editor。单击Add > Visualization > Filter Editor以打开过滤器编辑器可视化。
选择Dimension元素或过滤器作为因变量后,单击Set Target,输入用于描述该因变量的名称。 然后,单击OK(并确保突出显示过滤器框)以设置目标。
您为目标提供的名称即是因变量,将显示在左侧窗格中。
添加独立变量。
使用量度或维度元素添加独立变量。
量度. 从“倾向评分”工具栏的Metrics菜单中选择一个量度。
Dimension元素:在工作区中右键单击并选择 Table。选择一个或多个Dimension元素,然后使用<Ctrl>
+ <Alt>
键拖到Independent Variables下的左列或Element框。
已设置 Training Filter. 您可以通过单击“倾向评分”工具栏中的Options > Set Training Filter来定义要评分的访客集。 这将提供一组数据子集(专门由要进行评分的访客所构建)。例如,在上月进行过访问的访客,在澳大利亚居住的访客,或查看过特定产品的访客。
默认筛选器为Train on Everyone,但您可以通过在表中激活Dimension Elements或使用Filter Editor构建筛选器来更改默认筛选器。
选择Dimension元素或构建过滤器后,在激活后,单击选项 > 设置培训过滤器,输入描述该过滤器的名称,然后单击OK。
识别所有输入后,按Go。
多次传递数据,即开始评分过程。随后,它将以条形图的形式,透过一条百分比线显示结果。
保存倾向得分。
从 6.1 版开始,在使用“保存倾向得分”时为您提供了一个选项:
维度
维度和量度
您最终可以保存两个文件:维度和定义的量度。
注意:如果提交“倾向得分”进行处理,您只会得到维度。
派生的量度是相关的平均得分量度。
检查正确率。
系统将显示Model Complete,并在流程完成时生成评分模型。
右键单击Model Complete将识别系统定义的评分模型的准确性。 介于0%到100%之间的值将识别访客匹配Target变量的可能性。
混淆矩阵提供以下四个计数的组合:实际正值 (AP)、实际负值 (AN)、预测正值 (PP) 和预测负值 (PN)。将生成的评分模型应用于余下 20% 的测试数据(对此我们知道准确答案),可获取这些数值。如果得分高于 50%,则预测为正类情况(与定义的事件匹配)。
正确率 | 通过识别所有预测中包含的正确预测,来表示模型的正确率。 (TP + TN)/(TP + FP + TN + FN) |
查全率 | 识别重新标识评分模型的能力。 TP / (TP + FN) |
查准率 | 识别差异级别。 TP / (TP + FP) |