1、Hadoop的标志物是?
A 大象 B 长颈鹿 C 羚羊
D 鲨鱼正确答案A
1、BigTable对应Apache开源项目中的?
A Hive B Pig C Sqoop
D HBase正确答案D
1、Hadoop生态系统中,被作为ETL使用的软件是?
A Sqoop B Bigtop C Autoconf
D Oracle正确答案A
1、Hadoop生态系统中,由Facebook开源,使用SQL语言进行离线分析的软件是?
A Pig B Pheonix C Shark
D Hive正确答案D
1、Hadoop是由何种语言编写的?
A Scala B Erlang C Java
D Python正确答案C
1、下列哪些服务是在安装Hadoop时需要临时关闭?
A Bluetoothd B Avahi C Fuse
D Iptables正确答案D
1、HBase内置的分布式协同调度和锁叫做?
A Bookeeper B Zookeeper C Chubby
D Kafka正确答案B
1、Hadoop及其生态系统,可以部署在?
A Linux B OS/2 C DOS
D UNIX正确答案AD
1、当一个文件向HDFS上传时,首先需要访问的是?
A Datanode B Namenode C Jobtracker
D SecondaryNamenode正确答案B
2、通常来说一个map子进程对应几个数据块?
A 一个 B 二个 C 三个
D 更多正确答案A
1、文件上传到HDFS时,文件切分成数据块的工作是在?
A Namenode完成的 B Datanode完成的 C client完成的
D SecondaryNamenode完成的正确答案C
2、在执行任务时,Jobtracker首先会访问?
A Datanode B Namenode C Tasktracker
D SecondaryNamenode正确答案B
1、Hive中所使用的查询语言通常称之为?
A HQL B SQL C AQL
D QueryPlan正确答案A
二、多选题。每道题有两个或两个以上的正确答案。
1、下列关于Hive说法正确的是?
A 使用HQL作为查询接口。 B 使用HDFS作为底层存储。 C 使用MapRed作为执行层。 D 以上说法都正确。正确答案ABCD
1、关于ALTER TABLE page_view DROP PARTITION (dt=?2008-08-08?,country =?us?);下列说法正确的是?
A 增加分区 B 删除表 C 重命名表
D 修改字段正确答案B
二、多选题。每道题有两个或两个以上的正确答案。
1、下列关于合并小文件说法有误的是?
A 会给HDFS带来压力。 B 不会影响处理效率。
C 通过合并Map和Reduce的结果文件来消除影响。 D 会对电脑系统造成损坏。正确答案ACD
1、下列关于合并小文件说法正确的是? A 会给HDFS带来压力。 B 不会影响处理效率。
C 通过合并Map和Reduce的结果文件来消除影响。 D 会对电脑系统造成损坏。正确答案B
2、Hive和sql对比下列正确的是?
A Hive不支持索引 B sql不支持数据更新 C Hive扩展性好
D sql执行延迟高正确答案C
1、Pig的主要操作--store 操作_____。
A 循环指定数据集中的所有数据。 B 将制定数据集存储至指定目录。
C 联合操作,和sql中的union功能一致。
D join操作,和sql中的join功能一致。正确答案B
1、Pig的主要操作--store 操作_____。
A 循环指定数据集中的所有数据。 B 将制定数据集存储至指定目录。
C 联合操作,和sql中的union功能一致。
D join操作,和sql中的join功能一致。正确答案B
二、多选题。每道题有两个或两个以上的正确答案。
1、以下软件中,哪些是日志流的汇总工具?
A FlumeNG B Scribe C Rsync
D FTP正确答案AB
1、dfs.block.size - 数据块大小,默认是?
A 16M B 32M C 64M
D 128M正确答案C
2、io.sort.record.percent 索引空间所在比例,默认为()。
A 0.05 B 0.01 C 0.1
D 0.5正确答案A
1、关于Combiner组件,下面说法错误的是?
A Combiner组件的引入可减少Map Task输出数据量(磁盘IO)。 B Combiner组件的引入可减少Reduce-Map网络传输数据量(网络IO)。 C Combiner组件可看作是local reducer。
D 任何数据处理应用都可以用Combiner组件。正确答案D
2、关于Block和Split两个概念,下面说法错误的是? A Block是HDFS中最小的数据存储单位。 B Split是MapReduce中最小的计算单元。 C Block与Split是一一对应关系。
D Block和Split之间对应关系是任意的,可由用户控制。正确答案C
1、关于任务调度流程,下面说法错误的是?
A 客户端将作业提交到JobTracker,JobTracker通知任务调度器进行初始化。 B 任务调度器将任务分配给某个TaskTracekr。 C TaskTracker通过心跳领取分配给自己的任务。
D JobTracker将任务推送给对应的TaskTracker。正确答案D
二、多选题。每道题有两个或两个以上的正确答案。
1、关于MapReduce容错机制,下面说法正确的是?
A JobTracker可以有多个,因此不存在单点故障问题。
B TaskTracker通过周期性心跳向JobTracker表明自己还活着。 C Map Task失败后,能够被重新调度到其他节点上执行。
D Reduce Task失败后,能够被重新调度到其他节点上执行。正确答案BCD 1、下面哪一条不属于MapReduce安装模式? A 多线程模式 B Local模式 C 伪分布式模式
D 完全分布式模式正确答案A