在本例中,我们使用 CHAID 建模节点。CHAID,或卡方自动交互效应检测,是一种通过使用称作卡方统计量的特定统计类型识别决策树中的最优分割来构建决策树的分类方法。
如果在源节点中指定了测量级别,则可以去掉单独的“类型”节点。从功能上来说,结果是一样的。 该流中还包含“表”节点和“分析”节点,创建模型块并将其添加到流中后,将使用这两个节点查看评分结果。
Statistics 文件源节点从tree_credit.sav 数据文件读取 SPSS Statistics 格式数据,该文件安装在 Demos 文件夹中。(名为 $CLEO_DEMOS 的特殊变量用于引用位于当前 IBM? SPSS? Modeler 安装下的该文件。这样,无论当前的安装文件夹或版本是什么,均可以确保路径有效。)
类型节点指定每个字段的测量级别。测量级别是一种指示字段中数据类型的类别。我们的源数据文件使用三种不同的测量级别。
连续字段(例如年龄字段)包含连续的数字值,而名义字段(例如信用评价字段)有两个或多个不同值,例如不良、优良或无信用历史。有序字段(例如收入水平字段)用于描述具有顺序固定的不同值的数据,在本例中为低、中和高。
对于每个字段,类型节点还指定角色,以指示每个字段在建模中扮演的部分。将字段信用评价的角色设置为目标,此字段指示指定的客户是否拖欠贷款。这是目标,或者是要预测其值的字段。
对于其他字段,将角色设置为输入。输入字段有时也称为预测变量,或建模算法用其值来预测目标字段值的字段。
CHAID 建模节点生成模型。
在建模节点的“字段”选项卡中,已选中使用预定义角色,这意味着将按在类型节点中的指定使用目标和输入。我们可以在此处更改字段角色,但本例中我们不做任何更改使用这些角色。 ? 单击“构建选项”选项卡。
此处包含的选项可以用于指定要构建的模型类型。
由于我们想要一个全新的模型,因此使用默认选项构建新模型。
我们还要求它为单个标准决策树模型,并且不包含任何增强,因此保留默认目标选项构建单个树。 我们可以选择启动允许对模型进行微调的交互建模会话,本示例只使用默认设置生成模型来生成模型
对于此示例,我们希望保持树的结构简单,因此通过增加用于父节点和子节点的最小个案数限制树的增长。
? 在“构建选项”选项卡上,从左侧的导航器窗格选择停止规则。 ? 选择使用绝对值选项。
? 将父分支中的最小记录数设置为 400。 ? 将子分支中的最小记录数设置为 200。
在本例中,我们可以使用所有其他默认选项,因此单击运行以创建模型。(另外,也可以右键单击该节点,然后从上下文菜单中选择运行,或选择节点,并从“工具”菜单中选择运行。)