簡體   English   中英

Tableau Desktop:Count Distinct 返回的值高於 Count(如果連接到 Google Big Query)

[英]Tableau Desktop: Count Distinct returns higher value than Count (if connected to Google Big Query)

我有一個包含 2157 條記錄的表,假設有 3 列(A、B、C),我知道在 A 列中有 2154 個不同的值。

使用連接到 BigQuery 的 Tableau Desktop(及其自己的功能),我得到以下結果:

  • 計數(A) --> 2157
  • CountD(A) --> 2180(超過Count!!!)

如果我在 Big Query 控制台中使用查詢運行相同的計算,我會得到:

  • 計數 --> 2157
  • CountD --> 2154(右)

這怎么可能?

順便說一句,如果使用同一個表的 CSV 文件,並且我使用 Tableau Public(無桌面)將其用作數據源,我會像在 Big Query 中一樣得到正確的結果。

提前致謝

如果使用 DISTINCT 關鍵字,該函數將返回指定字段的不同值的數量。 請注意, DISTINCT 的返回值是統計近似值,不能保證准確 - 文檔對此也很清楚。

如果您需要 COUNT(DISTINCT) 的更高准確度,您可以指定第二個參數 n,它給出了保證准確結果低於該閾值的閾值。 默認情況下,n 為 1000,但如果您提供更大的 n,您將獲得 COUNT(DISTINCT) 的精確結果,直到該 n 值。 但是,賦予較大的 n 值會降低該運算符的可伸縮性,並且可能會顯着增加查詢執行時間或導致查詢失敗。

要計算不同值的確切數量,請使用EXACT_COUNT_DISTINCT 或者,對於更具可擴展性的方法,請考慮在相關字段上使用 GROUP BY,然后應用 COUNT(*)。 GROUP BY 方法更具可擴展性,但可能會導致輕微的前期性能損失。

https://cloud.google.com/bigquery/query-reference#aggfunctions

嘗試使用帶有此公式的計算字段 - RAWSQLAGG_INT("count(unique(%1))",['Your column'])

會降低性能,因此請僅在真正需要時使用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM