关于hive的疑问

在本地装了一个hive,要通过本机安装的这个hive操作一个远端的HDFS。
比如,要通过本地这个hive,将本地的数据写到远端的这个HDFS集群中,必须要在远端的这个HDFS集群中的任意一个节点上安装一个hive,然后通过HiveServer的方式,才能通过hive操作远端的HDFS?如果远端的这个HDFS集群中没有装hive,就只能通过dfsClient操作远端的这个HDFS么?

李虎翼 - Hive/Hadoop

赞同来自: wangxiaolei Riordon

你好。Hive CliDriver和 HiveServer2只要装在能访问Hadoop Client(DFSClient, YarnClient)的地方就可以了。 如果是BeeLine,更简单,只要装在能访问HiveServer2的地方就可以了。

fish - Hadooper

赞同来自: 对方正在输入中

1. Hive(我觉得你应该问的是Hive Client端)可以装在集群外的机器上,不一定需要装在集群中的机器上。 2. HiveServer是在希望通过“Remote Server mode”模式使用Hive时安装的服务,跟Hive本身是否能提交到集群上没有关系。Hive是否能正确提交到集群,是否能正确使用HDFS,取决于hive-site.xml中的配置是否正确。

wangxiaolei

赞同来自:

HiverServer是HiverServer hdfs集群是hdfs集群 它们是独立的。 因为训练营只有4台机器,所以每台机器需要启动很多服务。 这些并不代表HiveServer一定要启动在hdfs集群的机器上,仅仅是因为机器数太少。  

hadoopStudy

赞同来自:

我的意思是想问,如果在HDFS集群外面的一台机器上装一个hive,要通过这个hive操作HDFS,是不是必须在集群中的某一台机器上安装一个Hive??? 因为只有通过集群内安装的这个Hive的metastore才能搭建一个可以访问到这个HDFS的HiveServer,然后集群外的Hive就可以通过这个HiveServer来操作这个HDFS集群了,我的理解对么???

要回复问题请先登录注册