IBM SPSS Modeler 教程-(1) 下载本文

它们合并为一个汇总(整体)模型。此方法将自动化操作的方便性与组合多个模型的优势融为一体,从而产生任何单一模型所不能带来的更为准确的预测。

本示例以某虚构的公司为例,该公司希望通过为每个客户提供最适用的报价以获取更丰厚的收益。 本示例使用安装在 streams 目录下 Demo 文件夹中的流pm_binaryclassifier.str。所使用的数据文件为pm_customer_train1.sav。

文件 pm_customer_train1.sav 的历史数据可跟踪过去的营销活动中为特定客户提供的报价,由campaign 字段的值表示。Premium account 活动中的记录数最大。

campaign 字段的值在数据中实际编码为整数(例如 2 = Premium account)。稍后,您可为这些值定义标签以用于给出更有意义的输出。

此文件还包含一个响应字段,该字段表明所提供的报价是否被接受(0 = 否,1 = 是)。这将是您希望预测的目标字段或值。

此外,其中还包括若干包含每位客户的相关人口统计和财务信息的字段。这些字段可用于构建或“训练”一个可基于类似收入、年龄或每月交易次数等特征预测单个用户或用户群响应率的模型。

构建流

? 添加指向pm_customer_train1.sav 的 Statistics 文件源节点,该文件位于 IBM? SPSS? Modeler 安装程序的 Demos 文件夹中。(您可以在文件路径中指定$CLEO_DEMOS/ 作为引用此文件夹的快捷方式。请注意,路径中必须使用正斜线而非反斜线,如上文所示。)

添加类型节点,然后选择响应作为目标字段(“角色”为目标)。将此字段的“测量”设置为标志。

对于以下字段,应将角色设置为无:customer_id、campaign、response_date、purchase、

purchase_date、product_id、Rowid和 X_random。当您构建模型时,将忽略这些字段。 ? 单击类型节点的读取值按钮以确保值获得实例化。

从前文看出,我们的源数据包含有关四项不同活动的信息,每个活动针对不同类型的客户帐户。这些活动在数据中编码为整数,以方便记住每个整数所代表的帐户类型,让我们为每一个都定义标签。 ? 在活动字段的行上,单击值列中的条目。 ? 从下拉列表选择指定。

在标签列中,键入活动字段四个值中每个值所显示的标签。 ? 单击确定。