簡體   English   中英

如何基於flink流完成分區觸發氣流作業?

[英]How to trigger airflow jobs based on flink streaming completion for partitions?

我有一個flink流作業,該作業從Kafka讀取並寫入文件系統中的適當分區。 例如,作業配置為使用存儲在/ data / date = $ {date} / hour = $ {hour}的存儲接收器。

如何檢測該分區已准備好使用,以便相應的氣流管道可以在該小時的頂部進行一些批處理?

您可以查看ContinuousFileMonitoringSource的實現,以了解它如何監視文件系統。 然后執行與David Anderson在另一個問題中建議的類似操作,重新創建自定義ProcessFunction。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM