(1)简单容易上手:提供了类SQL查询语言HQL算法
(2)可扩展:为超大数据集设计了计算/扩展能力(MR做为计算引擎,HDFS做为存储系统)函数
通常状况下不须要重启服务Hive能够自由的扩展集群的规模。大数据
(3)提供统一的元数据管理设计
(4)延展性:Hive支持用户自定义函数,用户能够根据本身的需求来实现本身的函数数据挖掘
(5)容错:良好的容错性,节点出现问题SQL仍可完成执行效率
(1)hive的HQL表达能力有限集群
1)迭代式算法没法表达,好比pagerank扩展
2)数据挖掘方面,好比kmeansmap
(2)hive的效率比较低数据
1)hive自动生成的mapreduce做业,一般状况下不够智能化
2)hive调优比较困难,粒度较粗
3)hive可控性差