簡體   English   中英

在索引的文本字段中查找最常用的術語

[英]Find most frequent terms in a text field in an index

我想在最常索引的text字段中找到術語列表。 此列表將包含按其term.docFreq值反向排序的元素。 我一直在研究術語 vector API,但你必須事先知道這個術語。 term.docFreq是否提供了任何其他 API,它以term.docFreq值的反向排序順序提供列表?

如果我很好地理解您的問題,您的解決方案可能是這樣的:

  1. 您必須在您的字段映射中設置 "fielddata": true"。

  2. 您可以使用以下術語聚合來找到答案:

     GET index_name/_search { "aggs": { "NAME": { "terms": { "field": "your_field_name", "order": { "_count": "asc" } } } } }

通過此查詢,您將獲得頻率較低到較高的單詞。 如果您省略查詢中的順序部分,您將得到降序的結果。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM