我正在通过提供Nutch 1.2的种子链接(用于旅行域)来进行抓取。 接下来,我将使用Solr 3.1进行索引。 我在Serach引擎中得到搜索结果。 但是现在我想对索引结果进行评分,并将其显示在搜索引擎中。 我引用了URL:1) http://wiki.apache.org/solr/QueryElevationComponent ,它基本上是用于增强查询的。 2) http://wiki.apache.org/solr/SolrRelevancyFAQ#index-time_boosts ,用于增强文档。 如何在索引时间提高结果并检索结果?

提前致谢!

===============>>#1 票数:0

您提高结果的标准是什么?

SOLR已经根据术语出现的频率在计算文档相关性方面做得很好。

默认设置未涵盖您的具体要求?

  ask by Jana translate from so

未解决问题?本站智能推荐:

1回复

仅生成未提取的网址,而不是获得评分的Nutch 2.3

有什么方法可以只生成未提取的网址,而不是基于Nutch 2.x中的分数吗?
1回复

如何基于内向和外向在nutch 2.x中启用页面评分?

Nutch 1.x具有此功能,但是我在Nucht 2.x中找不到它。 胡言乱语中是否有任何选项可以启用它,或者我必须最终做到这一点?
1回复

Apache Nutch 2.3.1光学评分过滤器不起作用

我已经在小型集群上为Nutch 2.3.1配置了完整的Hadoop / Hbase生态系统。 我对Nutch中使用的评分算法感到好奇。 我在Nutch中找到并使用了光学计分滤镜。 为了找到其影响,我按照Nutch WIKI的指导在Nutch IN的不同步骤(dbupdate并生成阶段)检查
1回复

Nutch和Elasticsearch

我正在使用Elasticsearch,AngularJS和Nutch构建一个小型搜索应用程序。 我几乎完成了ES和AngularJS部分。 现在是Nutch和ES的时候了,使用Nutch抓取数据并将其索引到ES中。 我一直在将Nutch 1.10与ES 1.4一起使用。 我一直在使用Nu
1回复

Nutch与Solr

目前收集信息我应该使用Nutch与Solr(域 - 垂直网络搜索)。 你能建议我吗?
2回复

Eclipse中的Nutch

在配置Nutch的,还有第一个步骤“建立Nutch的Eclipse环境”上http://wiki.apache.org/nutch/RunNutchInEclipse对此我无法理解。 步骤号 3说 “此外,我们必须手动添加每个单独的插件src / java和src / test文件
2回复

Nutch提取超时

我正在尝试使用nutt-1.12爬网某些站点,但是对于种子列表中的某些站点,获取操作无法正常进行: 正如您在下面的日志中所看到的,(2)和(3)正常工作,而(1)导致超时,而链接本身在浏览器中正常工作。 由于我不想增加等待时间并进行大量尝试,因此我想知道是否还有另一种方法可以确定为什么
1回复

Nutch抓取结果为JSON

我正在使用apache-nutch-2.1来抓取。 是否有可能将抓取的结果作为json? 我使用apache-nutch-2.1写了一个java程序来抓取。 我将如何将已爬网结果作为JSON进行检索。 这可能是一个愚蠢的问题,但当我谷歌它。 与此无关。 如何添加我得到爬行结果的j
2回复

对Nutch的基本怀疑

现在我有一个项目,我需要构建一个搜索引擎,但是我无法使用Solr,只能使用nutrce和lucece,在论坛上进行即时搜索时,我发现很多人说nutch可以进行索引,所以我安装了nutch (1.4)和已爬网的数据,但意识到我没有索引文件夹或类似的东西,只有已爬网的数据。.所以,问题是,nutch
1回复

Nutch NoClassDefFoundError中的错误

我正在学习胡说八道,并且出现此错误。 我不太确定如何解决此问题 有谁知道解决此程序的方法? 我正在OS X登山线上奔跑..