繁体 English 中英

Apache Nutch，HBase，Hadoop，Solr，Gora中的混乱

[英]Confusion in Apache Nutch, HBase, Hadoop, Solr, Gora

原文 2015-03-26 19:26:43 3 1 hadoop/ solr/ hbase/ nutch/ apache-zookeeper

我对所有这些术语都是陌生的，并花了一些时间来理解它。 但是我有些困惑。 如果我错了，请纠正我。

Nutch：用于网络爬网，使用它我们可以爬网网页。 我们可以将这些网页存储在db中的某个位置。

Solr：Solr可用于索引Apache Nutch爬行的网页。 它有助于搜索索引网页。

HBase：用作与Hadoop交互的接口。 它有助于从HDFS实时获取数据。 它提供了用于交互的简单SQL类型接口。

Hadoop：它提供两种功能：一种是HDFS（Hadoop数据文件系统），另一种是采用Google算法提供的Map-Reduce功能。 它基本上用于离线数据备份等。

Gora和ZooKeeper：我不确定。

困惑：1）。 HBase是键值对数据库还是仅仅是Hadoop的接口？ 或者我应该问，没有Hadoop的HBase是否可以存在？ 如果是，您能否进一步解释其用法。

2）。 在没有索引到Solr的情况下，使用Apache Nutch进行爬网数据有没有用？

3）。 为了运行apache，我们需要HBase和Hadoop吗？ 如果没有，我们如何使它不起作用？

4）。 Hadoop是HBase的一部分吗？

1 个解决方案

这是关于HBase与Hadoop的简短讨论： HBase与Hadoop / HDFS之间的区别

因为HBase是基于Hadoop构建的，所以没有Hadoop就无法真正拥有HBase。

是的，您可以在没有Solr的情况下运行Nutch； 似乎没有很多用例，但是，很少有活用的例子。
是的，您可以在不使用Hadoop的情况下运行Nutch，但同样，在现实世界中，似乎没有很多人这样做。
是的，Hadoop是HBase的一部分，因为没有Hadoop，就没有HBase，但是Hadoop当然也用于其他用途。

Zookeeper用于Hadoop堆栈工作流程中的配置，命名，同步等。 Gora是一个内存管理/持久性框架，建立在Hadoop之上。

Hadoop，HBase和Apache Nutch兼容版本

[英]Hadoop, HBase and Apache Nutch compatible versions

Apache Hadoop与Gora的组合功能

[英]Combiner function in Apache Hadoop with Gora

在Amazon Web Services和本地上集成Solr + Hadoop和Nutch + Hbase

[英]Integrating Solr + Hadoop and Nutch + Hbase on Amazon Web Services and Local

在hadoop模式下运行nutch时不会运行nutra gora类

[英]nutch gora class not while running nutch in hadoop mode

apache hadoop，hbase和nutch组件分布，用于4个服务器集群

[英]apache hadoop, hbase and nutch components distribution for 4 servers cluster

将Apache Nutch 2.3与Hbase 0.94.14和Solr 5.2.1集成时出错

[英]Error while Integrating Apache Nutch 2.3 with Hbase 0.94.14 and Solr 5.2.1

在hadoop集群上使用HBase设置Nutch 2.2.1

[英]Nutch 2.2.1 setup with HBase on hadoop cluster

有关Nutch，Hadoop，Solr，MapReduce和Mahout的信息

[英]Information on Nutch , Hadoop , Solr, MapReduce and Mahout

HBASE-org.apache.hadoop.hbase.MasterNotRunningException

[英]HBASE - org.apache.hadoop.hbase.MasterNotRunningException

Hbase org.apache.hadoop.hbase.PleaseHoldException

[英]Hbase org.apache.hadoop.hbase.PleaseHoldException

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Hadoop，HBase和Apache Nutch兼容版本 Apache Hadoop与Gora的组合功能在Amazon Web Services和本地上集成Solr + Hadoop和Nutch + Hbase 在hadoop模式下运行nutch时不会运行nutra gora类 apache hadoop，hbase和nutch组件分布，用于4个服务器集群将Apache Nutch 2.3与Hbase 0.94.14和Solr 5.2.1集成时出错在hadoop集群上使用HBase设置Nutch 2.2.1 有关Nutch，Hadoop，Solr，MapReduce和Mahout的信息 HBASE-org.apache.hadoop.hbase.MasterNotRunningException Hbase org.apache.hadoop.hbase.PleaseHoldException

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM