繁体   English   中英

用户搜索输入的最佳Lucene查询

[英]best lucene query for user search input


我有1,000,000条记录的新闻存储库。我使用lucene库进行全文搜索,搜索我的新闻报道(标题,正文,新闻日期等)。我需要找到最佳查询,以便从用户输入中找到最相关的结果,我应该采用哪种策略或算法。用于实现这一目标

现在我使用这样的东西(标题^ 3.0身体^ 2.0),但我认为这很简单,我正在寻找更复杂的算法以获取更多相关结果。

如果您能帮助我找到我的朋友,我将不胜感激!

提高搜索的相关性需要时间和迭代的完善。

LucidImagination团队的写作很好(尽管非常基于solr): http ://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Search-Application-Relevance-Issues

您可能需要分析日志并将每个文档的综合浏览量添加到索引中,以便将其按排序顺序考虑在内。

只要捕获到幅度变化,这些数字就不必真正准确。

您还应该分析日志中的拼写错误。 清醒的家伙们也有一些关于将它们编入索引的播客或博客。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM