繁体   English   中英

在hadoop集群中,是否应该在所有节点上安装配置单元?

[英]In a hadoop cluster, should hive be installed on all nodes?

我是Hadoop / Hive的新手,我刚刚开始阅读文档。 有很多关于在群集模式下安装Hadoop的博客。 另外,我知道Hive运行在Hadoop之上。 我的问题是:Hadoop安装在所有集群节点上。 我是否还应该在所有群集节点上或仅在主节点上安装Hive?

不,它不是您在工作节点上安装的东西。 Hive是一个Hadoop客户端。 只需根据您在Hive站点上看到的说明运行Hive。

Cloudera的Hive安装指南

在您提交作业的客户端计算机上安装Hive; 您不需要在Hadoop集群中的节点上安装它。

Hive主要用于处理Hadoop中的结构化和半结构化数据。 我们还可以使用Hive执行分析大型数据集,这些数据集存在于HDFS和Amazon S3文件系统中。 为了查询数据,hive还提供了称为HiveQL的查询语言,类似于SQL。 使用Hive可以轻松地为数据分析运行Ad-hoc查询。 使用Hive我们不需要编写复杂的Map-Reduce作业,我们只需要提交SQL查询。 Hive将这些SQL查询转换为MapReduce作业。

最后,Hive SQL将转换为MapReduce作业,我们不必从Hadoop集群中的所有节点提交MapReduce作业,就像我们不需要在Hadoop集群的所有节点中安装Hive一样

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM