hive-参数-hivevar、hiveconf

一、hivevar与hiveconf的区别

命名空间 使用权限 详细描述
hivevar rw 用户自定义变量
hiveconf rw hive相关配置属性
system rw java定义的配置属性
env r Shell环境属性
通常我们可以使用hive -e查看有关hivevar与hiveconf的描述:
在这里插入图片描述
其中–define与hivevar定义变量是一致的。

二、hivevar与hiveconf的作用域

之前项目中涉及两个hive作业同时执行并需要传入相同key的参数,因此顾虑不清楚是否是线程安全。结论先行:hivevar与hiveconf作用域都是会话级别的,言外之意就是如果两个并发同时跑的作业同时传入一个相同key但是value不相同的值的参数,不会发生线程安全问题。

接下来说明一下验证方案:

开启两个终端会话,在两个终端下执行如何两个命令:

A终端会话先启动,并执行如下命令:

hive --hiveconf first_name=daxin666 --hivevar first_name=daxin777
B终端会话在A会话之后启动,并执行如下命令:

hive --hiveconf first_name=daxin666888 --hivevar first_name=daxin777888
之后查看A终端的变量值,你会发现并没有被B覆盖。所以是线程安全的,虽然没有翻阅源码,但是通过分析hive的执行过程依然可以明白为什么是线程安全的,因为hive是一个客户端工具,hive不需要分布式部署,因此也没有全局会话,hive只是作为一个翻译工具存在,将hive sql转化为mapreduce任务的客户端,每一次启动一个hive都是单独启动一个进程,因而各个进程之间是相互独立的,不存在共享变量,所以不会存在线程安全问题。

三、hivevar、hiveconf的使用

hiveconf变量取值必须要使用hiveconf作为前缀参数:${hiveconf:key}

但是对于hivevar取值可以不使用前缀hivevar:使用前缀: h i v e v a r : k e y 、 不 使 用 前 缀 : {hivevar:key}、不使用前缀: hivevar:key使:{key}

使用示例如下图:
在这里插入图片描述