如何在特定时间内运行 Spark 结构化流作业？

Question

I want to schedule a Spark structured streaming job each day.我想每天安排一个 Spark 结构化流作业。 The Job itself must run for a certain number of hours and then stop.作业本身必须运行一定的小时数然后停止。 So, how can I specify such time duration?那么，我该如何指定这样的持续时间呢？

Answer 1

You need to schedule job with databricks scheduler once a day and then in the code add a timeout to your query:您需要每天使用 databricks 调度程序安排作业，然后在代码中为您的查询添加超时：

query = (df.writeStream...)

  query.awaitTermination(timeoutInSeconds)
  query.stop()

如何在特定时间内运行 Spark 结构化流作业？

问题描述

1 个解决方案

解决方案1
3 2021-10-08 09:11:38

如何在特定时间内运行 Spark 结构化流作业？

问题描述

1 个解决方案

解决方案1 3 2021-10-08 09:11:38

解决方案1
3 2021-10-08 09:11:38