[英]best lucene query for user search input
我有1,000,000條記錄的新聞存儲庫。我使用lucene庫進行全文搜索,搜索我的新聞報道(標題,正文,新聞日期等)。我需要找到最佳查詢,以便從用戶輸入中找到最相關的結果,我應該采用哪種策略或算法。用於實現這一目標
現在我使用這樣的東西(標題^ 3.0身體^ 2.0),但我認為這很簡單,我正在尋找更復雜的算法以獲取更多相關結果。
如果您能幫助我找到我的朋友,我將不勝感激!
提高搜索的相關性需要時間和迭代的完善。
LucidImagination團隊的寫作很好(盡管非常基於solr): http ://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Search-Application-Relevance-Issues
您可能需要分析日志並將每個文檔的綜合瀏覽量添加到索引中,以便將其按排序順序考慮在內。
只要捕獲到幅度變化,這些數字就不必真正准確。
您還應該分析日志中的拼寫錯誤。 清醒的家伙們也有一些關於將它們編入索引的播客或博客。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.