簡體   English   中英

SQL/HIVE - 不同計數查詢 - SELECT COUNT (DISTINCT columns,..) 與帶有 DISTINCT 記錄子查詢的 SELECT COUNT(*) 有何不同

[英]SQL/HIVE - Distinct count query - How does SELECT COUNT (DISTINCT columns,..) differ from SELECT COUNT(*) with subquery of DISTINCT records

在 HIVE 中,我嘗試使用 2 種方法獲取不同行的計數,

  1. SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table);

  2. SELECT COUNT (DISTINCT columns) FROM table;

兩者都產生了不同的結果 第一個查詢的計數大於第二個查詢。 它們的工作方式有何不同? 提前致謝。

對您的查詢稍作更改,即為您的子查詢命名,例如:

SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table) myquery;

hive試試這個:

SELECT COUNT (DISTINCT nvl(columns,'NA')) FROM table;

或:

SELECT COUNT (DISTINCT coalesce(columns,'NA')) FROM table;

以上查詢輸出將與以下相同:

SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM