繁体   English   中英

在 GCP 数据流使用 apache beam 完成工作后,有什么方法可以进行处理吗?

[英]Is there any way to do processing after GCP dataflow has completed the job using apache beam?

在 GCP 数据流状态完成/完成后,有什么方法可以进行后期处理。 我有数据流从 GCP 存储中批量读取文件并执行一些外部 api 调用以进行转换并写回另一个文件的过程。 在所有批次都被转换/处理后,我需要做一些额外的处理。 有没有办法做到这一点? 我正在使用 Apache Beam 和模板来运行 GCP 数据流。

是的。 有两个选项需要提及:

  1. 您可以使用 Cloud Composer 来编排 Dataflow 作业以及之前和之后的其他操作。 请参阅这篇文章
  2. 如果您通过代码启动您的作业,您可以调用PipelineResult.waitUntilFinish() ,然后再运行其他代码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM