繁体   English   中英

如何通过TF / IDF分数获取文档中的单词列表

[英]How to get a list of words in a doc by TF/IDF scores

我有一个ElasticSearch索引。 给定索引中的文档ID,我想通过TF-IDF分数获取文档中的单词列表。 是否可以编写ES查询来获取列表?

提前致谢。

您可以检索文档中所有术语的列表,然后在搜索文档中的所有单词时使用explain。

例如:如果文档包含foo和bar,则查询为:

/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1

在分数说明中,您将看到每个单词的idf分数和tf分数。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM