如何做嵌套的SQL选择计数

Question

我正在查询不允许使用DISTINCT的系统 ，所以我的替代方法是执行GROUP BY以接近结果

我想要的查询应该看起来像这样，

SELECT 
SUM(column1) AS column1,
SUM(column2) AS column2,
COUNT(DISTINCT(column3)) AS column3
FROM table

作为替代方案，我认为我需要遵循这种方式的某种嵌套查询，

SELECT 
SUM(column1) AS column1,
SUM(column2) AS column2,
COUNT(SELECT column FROM table GROUP BY column) AS column3
FROM table

但这没用。 我靠近吗？

Answer 1

您使用的COUNT(DISTINCT)语法错误。 DISTINCT部分是关键字，而不是函数。 根据文档，这应该可以工作：

SELECT 
  SUM(column1) AS column1,
  SUM(column2) AS column2,
  COUNT(DISTINCT column3) AS column3
FROM table

但是，请阅读文档。 BigQuery的COUNT(DISTINCT)实现有点不寻常，显然是为了更好地扩展大数据。 如果要计算大量不同的值，则可能需要指定第二个参数（并且存在固有的缩放问题）。

更新：

如果您要计数大量不同的column3值，并且想要精确计数，那么也许可以执行联接，而不是将子查询放在选择列表中（BigQuery似乎不允许这样做）：

SELECT *
FROM (
    SELECT
      SUM(column1) AS column1,
      SUM(column2) AS column2
    FROM table
  )
  CROSS JOIN (
      SELECT count(*) AS column3
      FROM (
          SELECT column3
          FROM table
          GROUP BY column3
        )
    )

更新2 ：

并不是说连接两个单行表会很昂贵，但是@FelipeHoffa让我更加思考了这一点，并且我意识到我错过了一个更简单的解决方案：

SELECT
  SUM(column1) AS column1,
  SUM(column2) AS column2,
  COUNT(*) AS column3
FROM (
    SELECT
      SUM(column1) AS column1,
      SUM(column2) AS column2
    FROM table
    GROUP BY column3
  )

这将计算column1和column2值的小计，并按column3分组，然后对所有小计行进行计数和总计。 感觉不错。

Answer 2

FWIW，您尝试使用DISTINCT方式不是通常使用的方式，因为它的意思是显示唯一的行，而不是数据集中一列的唯一值。 GROUP BY更符合我认为您最终要实现的目标。

根据您的需要，您可以执行以下两项操作之一。 使用第二个查询，您需要修改子查询以获取计数，而不是实际值，例如：

SELECT 
SUM(column1) AS column1,
SUM(column2) AS column2,
(SELECT sum(1) FROM table GROUP BY column) AS column3
FROM table

或者，您可以从初始查询中进行查询，如下所示：

SELECT sum(column1), sum(column2), sum(column4) from (
SELECT 
SUM(column1) AS column1,
SUM(column2) AS column2,
1 AS column4
FROM table GROUP BY column3)
GROUP BY column4

编辑：上面是通用SQL，不太熟悉Google Big Query

Answer 3

您可能可以使用CTE

WITH result as (select column from table group by column)

SELECT 
SUM(column1) AS column1,
SUM(column2) AS column2,
Select Count(*) From result AS column3
FROM table

Answer 4

不用执行COUNT（DISTINCT），您可以通过先运行GROUP BY，然后对结果计数来获得相同的结果。

例如，莎士比亚按年份使用的不同单词数：

SELECT corpus_date, COUNT(word) different_words
FROM (
  SELECT word, corpus_date
  FROM [publicdata:samples.shakespeare]
  GROUP BY word, corpus_date
)
GROUP BY corpus_date
ORDER BY corpus_date

作为奖励，让我们添加一列来标识每年写的书：

SELECT corpus_date, COUNT(word) different_words, GROUP_CONCAT(UNIQUE(corpus)) books
FROM (
  SELECT word, corpus_date, UNIQUE(corpus) corpus
  FROM [publicdata:samples.shakespeare]
  GROUP BY word, corpus_date
)
GROUP BY corpus_date
ORDER BY corpus_date

如何做嵌套的SQL选择计数

问题描述

4 个解决方案

解决方案1
2 2015-04-09 16:11:16

解决方案2
0 2015-04-09 15:55:56

解决方案3
0 2015-04-09 16:02:52

解决方案4
0 2015-04-10 15:20:11

如何做嵌套的SQL选择计数

问题描述

4 个解决方案

解决方案1 2 2015-04-09 16:11:16

解决方案2 0 2015-04-09 15:55:56

解决方案3 0 2015-04-09 16:02:52

解决方案4 0 2015-04-10 15:20:11

解决方案1
2 2015-04-09 16:11:16

解决方案2
0 2015-04-09 15:55:56

解决方案3
0 2015-04-09 16:02:52

解决方案4
0 2015-04-10 15:20:11