[英]Get the most frequent terms of text field
如何獲取文本字段的所有單個標記及其文檔頻率的列表。 我希望這可以構建一個特定於域的頻繁(因此無用)停用詞列表。
這個問題涵蓋了我目前找到的所有方法,但是
您必須在您的字段上啟用 field_data 才能執行此操作。 但要小心,它會對使用的堆內存產生很大影響。
https://www.elastic.co/guide/en/elasticsearch/reference/current/fielddata.html
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.