繁体 English 中英

HBase mapreduce作业如何与服务器通信？（新手问题）

[英]How does HBase mapreduce job communicate with server? (newbie question)

原文 2011-06-27 15:43:50 9 3 java/ hadoop/ hbase

我是Hadoop和HBase的新手，即使我已经阅读过分配，但我仍然不了解MapReduce作业API的基本层次结构和工作流程。

据我了解，我将需要使用Java API来实现某些类，并将它们传递给hbase，后者将协调拆分和分发过程。 那是对的吗？

如果是这样，应用程序如何与服务器通信以传递地图减少作业的相关代码？ 我这里缺少链接...。

谢谢

3 个解决方案

当您运行HBase MapReduce作业时，您的类路径必须同时包含HBase和MapReduce配置文件。 配置文件将包含设置，例如JobTracker，HDFS NameNode和HBase主节点的位置。 然后，运行时将自动从配置文件中提取所有这些设置，以便您的作业知道要联系的服务器。

我认为您应该只完成基础教程，这应该使事情变得清楚。 我发现最快的入门方法是使用Cloudera VM 。

另外，我不确定您对HBase的引用。 您应该将Java类传递给Hadoop，而不是HBase。

但是，为了回答您的问题，应在群集中的所有节点上安装Hadoop。 Hadoop框架将负责管理地图并减少任务到节点。

使用HBase执行M / R作业的标准方法与执行非HBase m / r作业的方法相同：$ {HADOOP_HOME} / bin / hadoop jar .jar [args]

这会将您的jar复制到所有任务跟踪器（通过HDFS），以便它们可以执行您的代码。

使用HBase，您通常还会使用HBase实用程序：TableMapReduceUtil.initTableReducerJob

这使用内置算法来拆分HBase表（使用表的区域），以便可以将计算分布在m / r个作业上。 如果要使用其他拆分，则必须修改拆分的计算方式，这意味着您无法使用内置实用程序。

您可以指定的另一件事是返回的行上的条件。 如果您使用内置扫描条件，则无需执行任何特殊操作。 但是，如果要创建自定义比较器，则必须确保区域服务器在其类路径中具有此代码，以便它们可以执行它。 在走这条路线之前，请仔细检查内置比较器，因为它们非常强大。

HBase MapReduce作业：所有列值均为空

[英]Hbase mapreduce job: all column values are null

使用MapReduce作业删除HBase批量删除

[英]HBase bulk delete using MapReduce job

如何将 HBase 的扫描限制为 MapReduce 作业的仅相关（未过滤）区域

[英]How can I limit the scan of HBase to only relevant (Unfiltered) regions for the MapReduce job

jboss应用服务器新手问题

[英]jboss application server newbie question

HBase MapReduce

[英]HBase MapReduce

如何使用TableMapReduceUtil在HBase扫描仪结果上运行MapReduce

[英]How to run mapreduce on hbase scanner result with TableMapReduceUtil

如何使用MapReduce将CSV导入HBASE表

[英]How to import a CSV into HBASE table using MapReduce

聊天应用如何与其服务器通信？

[英]How does a chat app communicate with it's server?

HTTP前端服务器如何与Websphere通信

[英]How does HTTP frontend server communicate to Websphere

如何给输出一个mapreduce作业作为另一个mapreduce作业的输入？

[英]How to give output one mapreduce job as input of another mapreduce job?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 HBase MapReduce作业：所有列值均为空使用MapReduce作业删除HBase批量删除如何将 HBase 的扫描限制为 MapReduce 作业的仅相关（未过滤）区域 jboss应用服务器新手问题 HBase MapReduce 如何使用TableMapReduceUtil在HBase扫描仪结果上运行MapReduce 如何使用MapReduce将CSV导入HBASE表聊天应用如何与其服务器通信？ HTTP前端服务器如何与Websphere通信如何给输出一个mapreduce作业作为另一个mapreduce作业的输入？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM