簡體 English 中英

如何使用單個 Flink 應用程序提交多個 Flink 作業

[英]How to submit multiple Flink Jobs using Single Flink Application

原文 2020-08-02 10:00:41 9 1 apache-flink/ flink-streaming

假設我有一個 Flink 應用程序來過濾、轉換和處理 stream。

如何將此應用程序分成兩個作業並在不使用間歇性存儲的情況下對它們進行黑白通信。

有關數據流，請參閱下圖。

使用案例的原因：

事件大小： 2KB ，事件精簡： 200B ，TPS： 1M

為了有效使用 Java 堆來在任何給定時間存儲更多事件，需要進行轉換。 在單個 TaskManager 上執行所有這三個操作的缺點是也存儲攝取的事件，其中近 80% 的事件是不需要的。

在不同的任務管理器上運行這些作業將在擴展處理 function 方面提供極大的靈活性。

需要幫助來實現這一點，歡迎提出任何建議。 還試圖了解如何通過單個 Flink 應用程序提交多個作業。

1 個解決方案

幾點：

Flink 1.11 引入的應用模式，允許單個main()方法提交多個作業，但這些作業之間沒有直接通信的機制。 Flink 通過快照實現容錯的方法並沒有擴展到在不止一項工作中管理 state。

假設您可以將作業與套接字接收器和套接字源連接起來。 但是如果你這樣做，你將放棄容錯。

您可以通過配置一個插槽共享組來實現與您所要求的類似的事情，該組將管道的最后階段強制進入它們自己的插槽。 但是，這幾乎可以肯定是一個壞主意，因為它會強制執行 ser/de，否則這可能是不必要的，並且還會導致資源利用率降低。 但它會將這些流水線階段分成另一個 JVM。

如果目標是擁有可單獨部署和獨立擴展的組件，您可以通過使用帶有狀態函數 API的遠程函數來實現。

為了通過您展示的那種 ETL 作業最大化性能（並最小化垃圾收集），如果您利用運算符鏈接和 object 重用，並將所有內容放在一個作業中，您可能會更好。

Flink 從單個 jar 運行多個作業

[英]Flink runs multiple jobs from single jar

運行多個 flink 作業的問題（在 Flink 集群上）

[英]Issue running multiple flink jobs (on Flink Cluster)

合並多個 flink 作業的 output 並返回單個 output

[英]Merge output of multiple flink jobs and return single output

[apache-flink]如何將不同的flink作業提交到不同的紗線簇

[英][apache-flink]how to submit different flink jobs to different yarn clusters

Flink - 在 kubernetes 上部署 flink 應用程序的多個實例

[英]Flink - multiple instances of flink application deployment on kubernetes

如何在運行時配置flink作業？

[英]How to configure flink jobs at runtime?

如何在 Flink 作業中執行日志記錄？

[英]How to perform logging in Flink jobs?

Flink中一個作業中的多個作業或多個管道

[英]Multiple jobs or multiple pipelines in one job in Flink

同一個 Apache Flink 項目中的多個作業

[英]Multiple Jobs in the Same Apache Flink Project

在flink YARN集群作業中使用JNI

[英]Using JNI in flink YARN cluster jobs

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Flink 從單個 jar 運行多個作業運行多個 flink 作業的問題（在 Flink 集群上）合並多個 flink 作業的 output 並返回單個 output [apache-flink]如何將不同的flink作業提交到不同的紗線簇 Flink - 在 kubernetes 上部署 flink 應用程序的多個實例如何在運行時配置flink作業？如何在 Flink 作業中執行日志記錄？ Flink中一個作業中的多個作業或多個管道同一個 Apache Flink 項目中的多個作業在flink YARN集群作業中使用JNI

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM