Hive 优缺点

时间 2019-12-06 标签 hive 优缺点

（一）hive的优势

(1)简单容易上手：提供了类SQL查询语言HQL算法

(2)可扩展：为超大数据集设计了计算/扩展能力（MR做为计算引擎，HDFS做为存储系统）函数

通常状况下不须要重启服务Hive能够自由的扩展集群的规模。大数据

(3)提供统一的元数据管理设计

(4)延展性：Hive支持用户自定义函数，用户能够根据本身的需求来实现本身的函数数据挖掘

(5)容错：良好的容错性，节点出现问题SQL仍可完成执行效率

（二）hive的缺点（局限性）

(1)hive的HQL表达能力有限集群

1)迭代式算法没法表达，好比pagerank扩展

2)数据挖掘方面，好比kmeansmap

(2)hive的效率比较低数据

1)hive自动生成的mapreduce做业，一般状况下不够智能化

2)hive调优比较困难，粒度较粗

3)hive可控性差