簡體   English   中英

如何在 spark-scala 中計算持續時間

[英]How to compute for duration in spark-scala

我有 2 列是從紀元格式轉換而來的:

val df2 = df1.withColumn("event_end_ts", from_unixtime($"end_ts"/1000, "yyyy/MM/dd hh:mm:ss:ss"))
.withColumn("event_start_ts", from_unixtime($"start_ts"/1000, "yyyy/MM/dd hh:mm:ss:ss"))

這給了我這個:

 +----------------------+----------------------+ |event_end_ts |event_start_ts | +----------------------+----------------------+ |2022/05/24 03:49:01:01|2022/05/24 03:48:50:50| |2022/05/24 03:49:00:00|2022/05/24 03:48:51:51| |2022/05/24 03:50:03:03|2022/05/24 03:49:05:05| +----------------------+----------------------+

現在,我正在嘗試獲取 2 列的持續時間。 我試過這個,但它給出了一個空結果:

df2.withColumn("time_diff", (to_timestamp($"event_end_ts") - to_timestamp($"event_start_ts"))/3600)

您需要先將它們轉換為LongType ,如下所示:

df2.withColumn("time_diff", (to_timestamp($"event_end_ts").cast(LongType) - to_timestamp($"event_start_ts").cast(LongType))/3600)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM