在Lucene中,如果您有多个索引,每个索引只覆盖一个分区。 为什么不同索引上的相同搜索会返回不同分数的结果? 不同服务器的结果完全匹配。

即如果我搜索:

  • 姓名 - 约翰史密斯
  • DOB - 11/11/1934

分区0将返回0.345的分数

分区1将返回0.337的分数

两者都完全匹配名称和DOB。

===============>>#1 票数:19

评分包含反向文档频率(IDF)。 如果术语“John Smith”在一个分区中,0,100次,在分区1中,一次。 搜索John Smith的分数在分区1中将是更高的搜索,因为该术语更加稀缺。

为了解决这个问题,你必须让你的索引覆盖所有分区,否则你需要覆盖IDF。

===============>>#2 票数:13

因为如果我没有完全弄错的话,分数是根据索引确定的。

如果您有不同的索引(索引更多/更少或不同的数据),则得分会有所不同:

http://lucene.apache.org/core/3_6_0/scoring.html

(警告:包含数学:-))

===============>>#3 票数:8

您可能还会对explain()方法的输出以及生成的Explanation对象感兴趣,它会让您了解事物的得分方式。

  ask by Stephen Hendry translate from so

未解决问题?本站智能推荐:

1回复

Solr / Lucene:得分单个标签

我正在设计一个Lucene搜索索引,其中包括每个文档的排名标签。 例: 标签来自自动分类算法,该算法也分配分数。 如何设计索引,以便可以查询搜索以组合标记并返回最相关的结果? 示例,搜索java + learning 我最初为每个标签创建了一个FIELD,并使用排名来
1回复

如何在Zend Lucene上获得一场得分

我有类似以下代码的内容: 现在,我只想显示搜索后得分更高的value_...字段。 我该怎么办?
3回复

我如何规范化solr / lucene得分?

我正在努力研究如何提高solr搜索结果的得分。 我的应用程序需要从solr结果中获取分数,并根据查询的结果有多好来显示一些“星星”。 5星=差不多/精确到0星,意味着不能很好地匹配搜索,例如只有一个元素命中。 然而,我得到的分数从1.4到0.8660254都返回结果,我会给5星。 我需要
1回复

Lucene Analyzer查询和搜索结果的相关性得分

首先,对不起我的英语不好! 我是Lucene图书馆的新手(从上星期三开始),我试图了解如何根据找到的术语获得匹配文件的最佳相关性。 我使用Lucene 4.10.0(没有Solr) 我能够索引/搜索英文/阿拉伯文文本,并支持这些文本的突出显示。 现在我对搜索结果的相关性有
1回复

根据Lucene的任期位置,我有什么方法可以改变得分吗?

例如,如果我正在搜索带有术语“harry”的书名的索引,则“Dirty Harry”的得分与“Harry Potter”相同,当两个项目得分相同时,顺序是随机的。 我想把我的搜索词(哈利波特)开头的那个加权。 我宁愿不使用TermPostionVector,因为看起来这是我在搜索和评分完
1回复

解释涉及分选时的Lucene得分

在Lucene索引中搜索时,某些文档的topDocs.scoreDocs中得到空值。 请为我解释一下 topDocs.scoreDocs 中[]中的值 输出: doc = 2 score = NaN [ null ] doc = 44 score = NaN [ te
1回复

仅根据文件在lucene中出现更多术语来计算得分

我开始研究基于lucene.net引擎的简历检索(文档)组件。 它工作得很好,它可以获取文档并根据文档对其进行评分 VSM背后的想法是,相对于该术语在集合中的所有文档中出现的次数,查询术语在文档中出现的次数越多,该文档与查询的相关性就越高。 Lucene的实用评分功能源于以下
2回复

光标在lucene

如何设置我从Lucene搜索获得的搜索结果的游标(用于分页)。 有没有办法在lucene中做到这一点? 问候,贾加德什
1回复

Symfony和Lucene

解决了 请参阅下面的答案。 对于其他对此有疑问的人,问题保持不变。 我想使用lucene(或其他任何可以与symfony一起用于搜索的东西),但是我无法使sfLucene插件正常工作(例如,当我使用./symfony时,命名空间“ lucene”中没有任何任务)。 Lucene的
3回复

Lucene“或Queries”

我是Lucene的新手,我正在尝试进行类似的搜索 我真的迷失了,你能帮助我吗? 谢谢。