大数据技术原理及应用林子雨版课后习题答案解析

***

专业资料整理分享

答:Worker 的作用:借助于名称服务系统定位到

Master 的位置,并向 Master

发送自己的注册信息, Master 会为每个 Worker 分配一个唯一的 ID。在一个 Worker 中,它所管辖的分区状态信息被保存在内存。在每个超步中, 对自己所管辖分区中的每个顶点进行遍历,并调用顶点上的

Worker 会

Compute()函数。

Master 的作用:Pregel 采用检查点( CheckPoint )机制来实现容错。在每个超 步的开始,Master 会通知所有的 Worker 把自己管辖的分区的状态写入持久化存 储设备。 Master 周期地 ping 每个 Worker,Worker 收到 ping 消息后向 Master 反馈消息。如果在指定的时间间隔内没有收到某个 将它标为“失效”,并启动恢复模式。

Worker 的反馈,Master 就会

第 12 章

1、试述数据可视化的概念。

答:数据可视化是指将大型数据集中的数据以图形图像形式表示,

并利用数据分析和开发工

具发现其中未知信息的处理过程。 数据可视化技术的基本思想是将数据库中每一个数据项作 为单个图元素表示, 大量的数据集构成数据图像, 同时将数据的各个属性值以多维数据的形 式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。 2、试述数据可视化的重要作用。

答:①观测、跟踪数据。利用变化的数据生成实时变化的可视化图表,可以让人 们一眼看出各种参数的动态变化过程,有效跟踪各种参数值。

②分析数据。利用可视化技术,实时呈现当前分析结果,引导用户参与分析 过程,根据用户反馈信息执行后续分析操作,完成用户与分析算法的全程交互, 实现数据分析算法与用户领域知识的完美结合。

③辅助理解数据。帮助普通用户更快、更准确地理解数据背后的定义。 ④增强数据吸引力。枯燥的数据被制成具有强大视觉冲击力和说服力的图 像,可以大大增强读者的阅读兴趣。

3、可视化工具主要包含哪些类型?各自的代表产品有哪些?

答:主要包括入门级工具( Excel )、信息图表工具( Google Chart API 、D3、 Visual.ly 、Raphael、Flot 、Tableau、大数据魔镜)、地图工具( Modest Maps、

完美 WORD格式编辑

***

***

专业资料整理分享

Leaflet 、PolyMaps、OpenLayers、Kartography 、Google Fushion Tables 、Quanum GIS)、时间线工具( Timetoast 、Xtimeline 、Timeslide 、Dipity )和高级分析 工具(Processing 、NodeBox、R、Weka和 Gephi)等。

第十三章

69. 试分析推荐系统的动机以及所能解决的问题。

答:为了让用户从海量信息中高效地获得自己所需的信息,推荐系统应运而生。

推荐系统是大数据在互联网领域的典型应用,

它可以通过分析用户的历史记录来了解用

户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求

推荐系统是自动联系用户和物品的一种工具,

和搜索引擎相比, 推荐系统通过研究用户

帮助用户从海量信息中去发

的兴趣偏好, 进行个性化计算。 推荐系统可发现用户的兴趣点, 掘自己潜在的需求

9. 试列举几种推荐算法,并进行简要描述

答: 基于用户的协同过滤( UserCF),基于物品的协同过滤( ItemCF)

UserCF 算法的实现主要包括找到和目标用户兴趣相似的用户集合和找到该集合中的用 户所喜欢的、且目标用户没有听说过的物品推荐给目标用户

ItemCF 算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品。 要通过分析用户的行为记录来计算物品之间的相似度

ItemCF 算法主

6. 现有用户 a、b、c 和物品 A、B、C、D、E,其关系如图所示,请使用基于用户的协同过

滤算法,给出物品到用户倒排表的建立过程及用户相似度矩阵,并给用户 c 的推荐列表

完美 WORD格式编辑

***

***

专业资料整理分享

用户对应物品列表 用户 a 用户 b 用户 c

物品 A、B、C 物品 B、C、D、 E 物品 B、C

物品对应用户列表 物品 A 用户 a 物品 B 用户 a、b 物品 C 用户 a、b、c 物品 D 用户 b 物品 E 用户 b

相似度矩阵

a b c a 0 2 1 b 2 0 1 c

1 1 0

完美 WORD格式编辑

***

***

专业资料整理分享

W(A,B) = 2/ √3*4 W(A,C) = 1/ √3*2 W(B,C) = 1/ √4*2

P(c,B)= CA+CB = 1/ √3*2+1/ √4*2 P(c,C)= CA+CB = 1/ √3*2+1/ √4*2 P(c,A) = CA = 1/ P(c,D) = CB = 1/ P(c,E) = CB = 1/

√3*2 √4*2 √4*2

给予用户 c 的推荐列表为 : A 、B、 C

① 论述“德国工业 4.0 ”、“日本工业白皮书”内涵,说清国际上关于工业 工业物联网的内涵;②分析上述两个佛山市制造业的现状,与国际上工业

4.0 的要求、 4.0 要求的差距;

③如何在佛山市上述两个制造业的生产、仓储等环节布局传感器,进行生产、仓储等环节 的数据采集;④将人力资源数据、行政管理数据、销售数据、市场数据以及生产、仓储数 据进行整合构成企业大数据资源;⑤进行大数据分析框架设计,给出工业产品智能制造的 路径以及个性化工业产品设计的思路;⑥进行工业大数据运营,从而使运营大数据的企业 自身能够盈利的措施。

论述题:

结合大数据、人工智能技术,论述佛山市陶瓷制造业如何进行产业升级?

德国工业 4.0 可以概括为:一个核心,两个重点,三大集成,四个特征和六项措施。一 个核心:互联网 +制造业,将信息物理融合系统(

CPS)广泛深入地应用于制造业,构建智能

工厂、 实现智能制造。 两个重点: 领先的供应商策略, 成为“智能生产” 设备的主要供应者; 主导的市场策略,设计并实施一套全面的知识和技术转化方案,引领市场发展。三大集成: 企业内部灵活且可重新组合的纵向集成,

企业之间价值链的横向集成, 全社会价值链的端到

完美 WORD格式编辑

***

联系客服:779662525#qq.com(#替换为@)