簡體 English 中英

將 window 函數從 SQL 遷移到 spark scala

[英]Migrating window functions from SQL to spark scala

原文 2020-07-24 01:20:35 0 2 sql/ scala/ apache-spark-sql

這是一些 SQL 表達式，我正在嘗試遷移以激發 scala。

SELECT
 a.senderId,
 b.company_id,
 ROW_NUMBER() OVER(PARTITION BY a.senderId ORDER BY b.chron_rank) AS rnk
FROM df1 a
JOIN df2 b
ON a.senderId = b.member_id
WHERE a.datepartition BETWEEN concat(b.start_date,'-00') AND concat(b.end_date,'-00')

我對 window function 有點迷茫，我開始這樣的事情，

val temp = df2.join(df1, $"dimPosition.member_id" === $"df1.senderId")
    .select($"df1.senderId", $"df2.company_id")
    .......

2 個解決方案

嘗試這個-

df2.as("b")
      .join(df1.as("a"), $"a.senderId" === $"b.member_id" && $"a.datepartition".between(
        concat($"b.start_date",lit("-00")), concat($"b.end_date", lit("-00")))
      )
      .selectExpr("a.senderId",
        "b.company_id",
        "ROW_NUMBER() OVER(PARTITION BY a.senderId ORDER BY b.chron_rank) AS rnk")

試試這個..可能你會面臨where子句的問題..

val temp = df2.join(df1, $"dimPosition.member_id" === $"df1.senderId")
  .select($"df1.senderId", $"df2.company_id")
  .withColumn('rnk', ROW_NUMBER() OVER Window.partitionBy("senderId",")
  .orderBy("chron_rank"))
  .where(datepartition BETWEEN concat(b.start_date,'-00') AND concat(b.end_date,'-00'))

如何修復 spark sql 中 window 函數的錯誤不匹配輸入“分區”？

[英]How to fix the error mismatched input 'partition' for window functions in spark sql?

在 SQL/Spark 中使用 Window 函數執行特定過濾器

[英]Performing Specific Filter Using Window Functions in SQL/Spark

Dataframe上的Spark-SQL窗口函數-查找組中的第一個時間戳

[英]Spark-SQL Window functions on Dataframe - Finding first timestamp in a group

無法使用 WINDOW 函數（Spark SQL）計算 DISTINCT

[英]Not able to COUNT DISTINCT using WINDOW functions (Spark SQL)

SQL 或 Spark (Scala) 中的正則表達式

[英]A regex in SQL or Spark (Scala)

Spark / scala中的SQL查詢

[英]SQL queries in Spark/scala

從 sql 遷移到 mysql

[英]Migrating from sql to mysql

Count(*) 等效於 Scala 中的 Spark SQL

[英]Count(*) equivalent for Spark SQL in Scala

使用Scala在Spark SQL中編寫UDF

[英]writing a UDF in spark sql with scala

合並 Scala Spark sql 模式

[英]Merging Scala Spark sql schemas

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何修復 spark sql 中 window 函數的錯誤不匹配輸入“分區”？在 SQL/Spark 中使用 Window 函數執行特定過濾器 Dataframe上的Spark-SQL窗口函數-查找組中的第一個時間戳無法使用 WINDOW 函數（Spark SQL）計算 DISTINCT SQL 或 Spark (Scala) 中的正則表達式 Spark / scala中的SQL查詢從 sql 遷移到 mysql Count(*) 等效於 Scala 中的 Spark SQL 使用Scala在Spark SQL中編寫UDF 合並 Scala Spark sql 模式

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM