大数据技术原理及应用林子雨版课后习题答案解析 - 图文 下载本文

***

专业资料整理分享

第一章

1. 试述信息技术发展史上的 3 次信息化浪潮及具体内容。

信息化浪潮 第一次浪潮

发生时间 1980 年前后

标志 个人计算机

解决问题 信息处理

代表公司 Intel 、AMD、IBM、 苹果、微软、联想、 戴尔、惠普等

第二次浪潮 1995 年前后 互联网 信息传输 雅虎、谷歌、阿里 巴巴、百度、腾讯

第三次浪潮 2010 年前后 物理网、云计 算和大数据

信息爆炸 将涌现出一批新的 市场标杆企业

2. 试述数据产生方式经历的几个阶段

答: 运营式系统阶段,用户原创内容阶段,感知式系统阶段。

3. 试述大数据的 4 个基本特征

答:数据量大、数据类型繁多、处理速度快和价值密度低。

4. 试述大数据时代的“数据爆炸”的特性

答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年 50%的速度增长,也就是说,每两年增加一倍。

5. 数据研究经历了哪 4 个阶段?

完美 WORD格式编辑

***

***

专业资料整理分享

答:人类自古以来在科学研究上先后历经了实验、 理论、计算、和数据四种范式。

6. 试述大数据对思维方式的重要影响

答:大数据时代对思维方式的重要影响是三种思维的转变: 而非精确,相关而非因果。

全样而非抽样, 效率

7. 大数据决策与传统的基于数据仓库的决策有什么区别

答:数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、 载能力,能结合历史数据和实时数据实现查询分析和自动规则触发, 战略决策和战术决策。

大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。

传播和加 从而提供对

8. 举例说明大数据的基本应用

答: 领域 金融行业

大数据的应用

大数据在高频交易、社区情绪分析和信贷风险分析三大金融创 新领域发挥重要作用。

汽车行业

利用大数据和物联网技术的五人驾驶汽车,在不远的未来将走 进我们的日常生活

互联网行业

借助于大数据技术,可以分析客户行为,进行商品推荐和有针 对性广告投放

个人生活

大数据还可以应用于个人生活,利用与每个人相关联的“个人 大数据”,分析个人生活行为习惯,为其提供更加周全的个性 化服务。

9. 举例说明大数据的关键技术

完美 WORD格式编辑

***

***

专业资料整理分享

答:批处理计算,流计算,图计算,查询分析计算

10. 大数据产业包含哪些关键技术。

答:IT 基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据 应用层。

11. 定义并解释以下术语:云计算、物联网

答: 云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机 能力,用户只需要在具备网络接入条件的地方, 就可以随时随地获得所需的各种 IT 资源。

物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网

等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成 人与物、物与物相连,实现信息化和远程管理控制。

12. 详细阐述大数据、云计算和物联网三者之间的区别与联系。

大数据、云计算和物联网的区别

大数据、云计算和物联网的联系

大数据侧重于海量数据的存储、 处理与 从整体来看,大数据、云计算和物联网 分析,海量数据中发现价值,服务于生 产和生活; 云计算本质上皆在整合和优 化各种 IT 资源并通过网络已服务的方

云计算,云计算的分布式存储和管理系

法,廉价地提供给用户;物联网的发展 目标是实现呜呜向量, 应用创新是物联 网的核心

统提供了海量数据的存储和管理能力, 没有这些云计算技术作为支撑, 大数据

分析就无从谈起。 物联网的传感器源源 不断的产生大量数据, 构成了大数据的 重要数据来源, 物联网需要借助于云计 算和大数据技术, 实现物联网大数据的 存储、分析和处理。

这三者是相辅相成的。 大数据根植于云 计算,大数据分析的很多技术都来自于

完美 WORD格式编辑

***

***

专业资料整理分享

第二章

13. 试述 hadoop和谷歌的 mapreduce、gfs 等技术之间的关系

答:Hadoop的核心是分布式文件系统 HDFS和MapReduc,e HDFS是谷歌文件系统 GFS的开源实现, MapReduces是针对谷歌 MapReduce的开源实现。

14. 试述 Hadoop具有哪些特性。

答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在 支持多种编程语言

Linux 平台,

15. 试述 Hadoop在各个领域的应用情况。

答:2007年,雅虎在 Sunnyvale 总部建立了 M45——一个包含了 4000 个处理器 和 1.5PB 容量的 Hadooop集群系统;

Facebook主要将 Hadoop平台用于日志处理,推荐系统和数据仓库等方面;

百度主要使用 Hadoop于日志的存储和统计、 网页数据的分析和挖掘、 商业分析、 在线数据反馈、网页聚类等。

16. 试述 Hadoop的项目结构以及每个部分的具体功能。

答:

Pig Chukwa Hive HBase

MapReduce HDFS Zookeeper

完美 WORD格式编辑

***