繁体   English   中英

Apache Lucene中的单词关联搜索

[英]Word association search in Apache Lucene

我需要关联属于一个常见主题的数学术语。 例如,角度,cos,tan等应与三角学有关。 因此,当用户搜索角度,三角形等时,搜索也应显示与三角学有关的结果。 谁能提供有关如何在Apache Lucene中执行此操作的线索?

有一个分类API ,其中包括K最近邻朴素贝叶斯模型。

您将首先在训练集中使用train()方法。 训练分类器后,请使用assignClass()方法对给定的字符串进行分类。

对于培训集,您可以使用给定课程的Wikipedia页面。

在尝试了这两个之后,您可以利用Classifier接口来构建竞争模型。

如果您已经知道关联,则可以将它们添加到特定术语的索引中,即将“ cos”索引为“ cos”,“三角”。

同样,如果您知道关联,则可以为父项和所有同级项建立索引,即将“ cos”索引为“三角”,“ cos”,“ sin”等。这听起来更像您想要的。

除了@Josh S.的很好答案之外,您还可以采用更直接的方法来生成自己的同义词词典,例如,请参阅使用Solr将单词与相似单词匹配吗?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM