9.“分类剖面图”选项卡 “分类剖面图”选项卡显示每个分类中存在的序列。分类列在“状态”列右边的单个列中。在查看器中,Model.samples 行表示序列数据,Model 行说明了分类中各项的总体分布。Model.samples 行的每个单元中颜色序列的每个线条表示分类中随机选中的用户的行为。单个序列直方图中的每个颜色代表一个模型。
10.分类特征”选项卡 “分类特征”选项卡汇总了分类中各状态间的转换,其中的各栏说明了所选分类属性值的重要性。例如,在分类 4 中,其中一个最重要的特征是客户倾向于先在4月进行购物。
11.分类辨别”选项卡 使用“分类辨别”选项卡,可以比较两个分类,确定模型及其倾向的分类。该选项卡包括四个列:“变量”、“值”、“分类 1”和“分类 2”。如果分类倾向于特定模型,则在“变量”列中相应模型行的“分类 1”或“分类 2”列中将出现一个蓝条。蓝条越长,模型越倾向于该分类。例如,在查看器中使用“分类辨别”选项卡,可以通过在“分类 1”中选择分类 2 以及在“分类 2”中选择分类 5,来比较分类 2 和分类 5。
12.状态转换”选项卡 在“状态转换”选项卡上,可以选择分类并浏览其状态转换。每个节点都表示模型的一个状态。线条表示状态间的转换,每个节点都基于转换的可能性。背景色表示分类中节点的频率。例如,从“分类”中选中“分类 3”,选中 商品ID节点,然后将“所有链接”滑块降低几格。
6.3 聚类分析
设计内容:根据超市现有数据,用决策树、聚类分析等分析方法分析出哪些条件对顾客购买商品的影响,哪些产品的销量最好,哪些产品应该摆放在一起提高销售量,哪些产品应该适当促销提高收入。平均交易间隔时间和次数等问题的分析, 设计思路: 将数据导入sqlserver2008中后,可以利用数据挖掘教材对数据进行
操作,进行数据挖掘,数据模型设计等的相关操作,同时运用它对数据的决策树设计,聚类分析等分析数据间的关系。 工作流程:1.将超市execel表格中的数据导入sqlserver 2008企业管理器中的
sqlserver 2008数据库中;
2.将超市数据源在analysis里面更新; 3.创建超市数据的挖掘模型。
4.首先是对两个表销售流水表和品牌表进行模型设计。 5.创建多维数据集成功后进行存储设计处理; 6.浏览创建好的数据挖掘模型的下钻;
7.创建决策树、聚类分析的数据挖掘模型,分析超市如何运用OLAP和依赖性分析来了解顾客购买习惯和商品之间的关联,正确的摆放商品位置以及如何运用促销手段对商品进行销售。 1.销售流水表
(聚类分析)分类关系图
从图中可以看出只有分类5和分类8只有最强的关联性,无论两个的关系如何变化,只要有5商品则必然有8商品,所有链接的关系越大,则他们的关系越复杂。各个商品的关系也越来越明确。 分类剖面图
从分类剖面图可以看出各个商品在总的商品中所占的比例,为我们分析数据提供一定的方便。 分类特征
该表展示了所有商品的属性在所有类型中所占的比例,从而分析各个属性的影响因素。 分类对比
6.4决策树
决策树关系图
依赖关系网络