如何查詢elasticsearch中的distinct count分布

Question

基數聚合查詢計算不同值的近似計數。 我們如何計算文檔的基數分布？

例如假設我們有：

a,a,a,b,b,b,c,c,d,d,e

不同的計數分布是：

3: 2 # count of distint element that have 3 occurnes (a, b) 
2: 2 # c, d
1: 1 # e

Answer 1

實際上你不能像這樣進行聚合。

但是，使用transform API ( https://www.elastic.co/guide/en/elasticsearch/reference/current/transform-examples.html ) 您可以創建一個新索引來進行簡單的terms聚合：

PUT _transform/so
{
  "dest" : {
   "index" : "my-so"
  },
  "source": {
    "index": "my-index"
  },
  "pivot": {
    "group_by": { 
      "country": {
        "terms": {
          "field": "letter"
        }
      }
    },
    "aggregations": {
      "cardinality": {
        "value_count": { 
          "field" : "letter"
        }
      }
    }
  }
}

這會給你：

[
    {
      "country" : "a",
      "cardinality" : 22
    },
    {
      "country" : "b",
      "cardinality" : 4
    },
    {
      "country" : "c",
      "cardinality" : 5049
    }...

然后，您可以使用簡單的術語或直方圖聚合：

GET /my-so/_search
{
  "size" : 0,
  "aggs": {
    "cc": {
      "terms": {
        "field": "cardinality"
      }
    }
  }
}

如何查詢elasticsearch中的distinct count分布

問題描述

1 個解決方案

解決方案1
1 已采納 2022-02-09 19:58:49

如何查詢elasticsearch中的distinct count分布

問題描述

1 個解決方案

解決方案1 1 已采納 2022-02-09 19:58:49

解決方案1
1 已采納 2022-02-09 19:58:49