中体骏彩大数据面试题

中体骏彩

中体骏彩大数据面试题

 

1.HDFS 客户端首先下面哪个程序获取数据信息()

a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker

2.HDfS中的block 默认保存几份()

a)3份b)2份c)1份d)不确定

3.下列哪个程序通常与NameNode 在一个节点启动()

a)SecondaryNameNode b)DataNode cTaskTracker dlobtracker

4.Client端上传文件的时候下列哪项正确()

a)数国经过NameNode 传递给DataNode

b)Client端将文件切分为Block.依次上传

c)Client只上传数据到一台DataNode,然后由NameNode 负责Block 复制工作

5.下面与HDFS类似的框架是()

a)TFS b)T32

c)GFS d)EXT3

6.下列哪项通常是集群的最主要瓶颈()

a)CPU b)网络 c)磁盘 IO d)内存

7.关于SecondaryNameNode哪项是正确的()

a)它是NameNode的热备

b)它对内存没有要求

c)它的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间

d)SecondaryNameNode应与NameNode部署到一个节点

8.配置机架感知的下面哪项正确()

a)如果一个机架出问题,不会影响数据读写

b)写入数据的时候会写到不同机架的DataNode中

c)MapReduce会根据机架获取离自己比较近的网络数据

9.HBase来源于哪篇论文()

A)TheGoogle File System

B)MapReduce

C)BigTable

D)Chubby

10.HBase数据存储底层是()

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

11 HBase消息通信机制是()

A)Zookeeper

B)Chubby

C)RPC

D)Socket

12下面所选项正确描述了HBase的特性()

A)高可靠性 B)高性 C)面向列 D)可伸缩

13 LSM含义是()

A)日志结构合并树

B)二叉树

C)平衡二叉树

D)长平街二叉树

14、下面对LSM结构描述正确的是()

A)顺序存储

B)直接写硬盘

C)需要将数据flush到磁盘

D)是一种搜索平衡树

15 LSM结构的数据首先存储在()

A)硬盘上

B)内存中

C)磁盘阵列中

D)闪存中

16.HFle数据格式中的DaA)字段用于()

A)存储实际的KeyValue数据

B)存储数据的起点

C)指定字段的长度

D)存储数据块的起点

17.HFile数据格式中的KeyVaue 数据格式中Value部分是()

A)拥有复杂结构的字符串

B)字符串

C)二进制数据

D)压缩数据

18.关于HBase二级索引的描述,哪些是正确的()

A)核心是倒排表

B)二级索引概念是对应Rowkey这个“一级”索引

C)二级索引使用平衡二叉树

D)二级索引使用LSM结构

19.下列关于Bloom Filter 的描述正确的是()

A)是一个很长的二进制向量和一系列随机映射函数

B)没有误算率

C)有一定的误算率

D)可以在Bloom Flter中删除元素

20.请列出hadoop的进程名称和其功能

21.一个datanode宕机,怎么一个流程恢复

22.用mapredce怎么处理数据倾斜问题

23.hive内部表和外部表的区别,生产环境中为什么建议使用外部表

24.Spark应用执行的流程流程

大数据培训