繁体   English   中英

使用一个索引作为另一索引中的术语来源

[英]Use one index as a source of terms in another index

我有两个索引,一个是特定短语的列表,另一个是可能包含(或可能不包含)这些搜索短语的文档。

我的索引如下所示:

短语

  • 短语

文件资料

  • 创作者
  • 最近更新时间
  • documentText

对于阶段索引中的每个短语,我希望对文档索引中的文档进行计数,其中documentText包含短语索引中的短语。

例如,如果结果将被格式化为表格,我期望是这样的:

|   Phrase   | Count of documents |
|------------|--------------------|
| "phrase 1" |                 10 |
| "phrase 2" |                 12 |

我可以在单个索引中使用术语聚合来做到这一点,但无法弄清楚索引之间如何实现。

据我所知,使用Elastic开箱即用是不可能的。 相反,我最终更新了每个文档以包含相关短语。

为此,我编写了一个小型控制台应用程序,该应用程序遍历了词组索引中的每个值,并搜索了该词组。 然后,我遍历每个返回的文档,并将该短语添加到“短语”属性中。

然后,我可以基于该属性对集合进行汇总查询。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM