簡體   English   中英

禁用IDF計算

[英]Disable IDF calculation

在我的特定用例中,作為TF-IDF算法的一部分計算的IDF因子會弄亂我的查詢得分。 基本上,我希望查詢只考慮術語頻率。 對於特定索引,是否可以禁用IDF因子,即將其設置為1? 我已經查看了相似性模塊(版本0.90.X),但還沒有找到任何可以幫助的東西; 同樣適用於function_score查詢。 我是否需要在java中編寫自定義的Similarity類? 或者是否有我想要實現的插件?

那么constant_score查詢怎么樣?

http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/ignoring-tfidf.html

不要猶豫使用?explain = true來看看得分是如何起作用的。

正如你可以在沒有constant_filter的情況下那樣:

隨着IDF

並使用constant_filter查詢(包裝您的真實查詢):

沒有IDF

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM