![](/img/trans.png)
[英]SQL/HIVE - Distinct count query - How does SELECT COUNT (DISTINCT columns,..) differ from SELECT COUNT(*) with subquery of DISTINCT records
[英]SQL query to count distinct count from 2 columns
我有名為table的SQL表
Document Word
-------------------
doc1 Hello
doc1 Hi
doc1 Welcome
doc1 Hello
doc2 Welcome
doc2 Welcome
doc3 Hi
doc3 Hello
doc3 Good Luck
這意味着我有文檔列表,每個文檔包含一些單詞,每個文檔的每個單詞都有我的原始單詞,如果一個單詞在同一文檔中出現兩次,我將有2個原始單詞。 我想獲得一個不同單詞的列表,其中包含出現多少文檔,無論出現多少次。 因此,該表的輸出應為
Hello: 2 --> which means it appeared in 2 documents
Hi: 2
Welcome: 2
Good Luck: 1
任何人都可以幫助我編寫將返回此結果的查詢嗎?
你想要count(distinct)
:
select word, count(distinct document)
from t
group by word;
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.