簡體   English   中英

如何通過TF / IDF分數獲取文檔中的單詞列表

[英]How to get a list of words in a doc by TF/IDF scores

我有一個ElasticSearch索引。 給定索引中的文檔ID,我想通過TF-IDF分數獲取文檔中的單詞列表。 是否可以編寫ES查詢來獲取列表?

提前致謝。

您可以檢索文檔中所有術語的列表,然后在搜索文檔中的所有單詞時使用explain。

例如:如果文檔包含foo和bar,則查詢為:

/MY_INDEX/MY_TYPE/_search?q=_id:MY_ID foo bar&explain=true&size=1

在分數說明中,您將看到每個單詞的idf分數和tf分數。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM