簡體   English   中英

用戶搜索輸入的最佳Lucene查詢

[英]best lucene query for user search input


我有1,000,000條記錄的新聞存儲庫。我使用lucene庫進行全文搜索,搜索我的新聞報道(標題,正文,新聞日期等)。我需要找到最佳查詢,以便從用戶輸入中找到最相關的結果,我應該采用哪種策略或算法。用於實現這一目標

現在我使用這樣的東西(標題^ 3.0身體^ 2.0),但我認為這很簡單,我正在尋找更復雜的算法以獲取更多相關結果。

如果您能幫助我找到我的朋友,我將不勝感激!

提高搜索的相關性需要時間和迭代的完善。

LucidImagination團隊的寫作很好(盡管非常基於solr): http ://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Search-Application-Relevance-Issues

您可能需要分析日志並將每個文檔的綜合瀏覽量添加到索引中,以便將其按排序順序考慮在內。

只要捕獲到幅度變化,這些數字就不必真正准確。

您還應該分析日志中的拼寫錯誤。 清醒的家伙們也有一些關於將它們編入索引的播客或博客。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM