簡體 English 中英

如何聚合 spark SQL 中將其作為新列的列的非重復計數？

[英]How to aggregate on the distinct count of a column in spark SQL that put it as a new column?

原文 2022-03-09 00:31:01 1 2 sql/ pyspark/ apache-spark-sql

spark.sql(f""" 
          INSERT INTO {databaseName}.{tableName} 
          SELECT 
              '{runDate}'
            , client_id
            , COUNT(DISTINCT client_id) AS distinct_count_client_id
          FROM df """)

所以說我有一個 client_id 列有重復值，我想有一個客戶 ID 的聚合不同計數列，我將如何在 pyspark 中實現它？ 上面的代碼不起作用。

2 個解決方案

您可以使用 HAVING。 試試這個代碼：

spark.sql(f""" 
      INSERT INTO {databaseName}.{tableName} 
      SELECT 
          '{runDate}'
        , client_id
        , COUNT(*) AS client_id
        group by client_id HAVING COUNT(client_id) > 1
      FROM df """)

您可以使用size和collect_set函數來實現 count distinct function。

spark.sql(f""" 
          insert into {databaseName}.{tableName} 
          select 
              '{runDate}'
              ,client_id
              ,size(collect_set(client_id) over (partition by null)) as distinct_count_client_id
          from df
          """
)

如何計算SQL Server中的不同列

[英]How to count distinct column in SQL Server

SQL/Hive 計數不同的列

[英]SQL/Hive count distinct column

SQL查詢：如何通過另一列區分列組的計數

[英]SQL query: how to distinct count of a column group by another column

SQL如何在另一列不同時計算一列

[英]SQL How to count one column when another column is distinct

基於sql中另一列的列中的不同計數

[英]Distinct count in a column based on another column in sql

Spark SQL：匯總組中的列值

[英]Spark SQL: Aggregate column values within a Group

Oracle SQL-如何動態獲取每列的不重復計數？

[英]Oracle SQL - How to get distinct count for each column dynamically?

如何根據Sql server中3列的3個不同值查找列數？

[英]How to find count of column, based on 3 distinct values of 3 columns in Sql server?

SQL：如何獲取不同的值，它在單獨的列中計數

[英]SQL: How to get distinct value and it's count in separate column

用sql計算不同值在另一列中重復的次數

[英]Count how many times distinct values repeat in another column with sql

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何計算SQL Server中的不同列 SQL/Hive 計數不同的列 SQL查詢：如何通過另一列區分列組的計數 SQL如何在另一列不同時計算一列基於sql中另一列的列中的不同計數 Spark SQL：匯總組中的列值 Oracle SQL-如何動態獲取每列的不重復計數？如何根據Sql server中3列的3個不同值查找列數？ SQL：如何獲取不同的值，它在單獨的列中計數用sql計算不同值在另一列中重復的次數

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM