簡體 English 中英

如何在 AWS EMR 中擴展 Flink 作業

[英]How to scale up Flink job in AWS EMR

原文 2022-09-16 03:18:31 0 1 apache-flink/ flink-streaming

我有一個在 AWS EMR 中運行的 flink（版本1.8 ）作業，它目前位於作業管理器和任務管理器的m5.xlarge上。 有1個工作經理和4個任務經理。 一個m5.xlarge有 4 個 vCPU 和 16 GB RAM。

創建紗線 session 時，我傳入以下參數： -n 4 -s 4 -jm 768 -tm 103144 。

工作節點設置為 16 的並行度。

目前，flink 作業運行有點慢，所以我想讓它更快。 我嘗試使用m5.2xlarge （8 個 vCPU 和 32 GB RAM）進行不同的配置，但在部署時遇到了問題。 我認為這是因為我沒有正確的數字來正確使用新的實例類型。 我嘗試使用插槽數、jm/tm memory 分配和並行數，但不能完全正確。 如果我將擁有的資源量翻倍，我將如何調整我的 flink 作業參數？

1 個解決方案

我不得不說“這取決於”。 您需要將並行度加倍。 默認情況下，我會通過將任務管理器的數量增加一倍來實現這一點，並將它們配置為與現有 TM 相同。 但在某些情況下，最好將每個 TM 的插槽加倍，並為 TM 提供更多 memory。

在您運行的規模上，我不希望它有太大的不同。 任何一種方法都應該可以正常工作。 在更大的規模上，我傾向於切換到 RocksDB（如果你還沒有使用它），並運行更少、更大的 TM。 如果您需要使用基於堆的 state 后端，您最好使用更多、更小的 TM。

通過Flink REST API在AWS EMR上運行Flink作業

[英]Run Flink job on AWS EMR through Flink REST API

如何向 EMR 提交 flink 流作業？

[英]How to submit flink streaming job to EMR?

如何在 AWS EMR (ElasticMapReduce) 中監控 Apache Flink？

[英]How to monitor Apache Flink in AWS EMR (ElasticMapReduce)?

QueryableState Flink AWS EMR

[英]QueryableState Flink AWS EMR

如何擴展一個消耗巨大主題的 Flink Job

[英]How to scale a Flink Job that consumes a huge topic

在 EMR 上使用 JNI 的 Flink 作業

[英]Flink job using JNI on EMR

AWS EMR 任務節點上的 Flink

[英]Flink on AWS EMR Task Nodes

管道部署時在 AWS EMR 集群上自動提交 Flink 作業的推薦方法是什么

[英]What is recommended way to automate Flink Job submission on AWS EMR cluster while pipeline deployment

EMR上的Flink作業僅在一個TaskManager上運行

[英]Flink job on EMR runs only on one TaskManager

AWS EMR - Apache Flink Web 客戶端

[英]AWS EMR - Apache Flink web client

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 通過Flink REST API在AWS EMR上運行Flink作業如何向 EMR 提交 flink 流作業？如何在 AWS EMR (ElasticMapReduce) 中監控 Apache Flink？ QueryableState Flink AWS EMR 如何擴展一個消耗巨大主題的 Flink Job 在 EMR 上使用 JNI 的 Flink 作業 AWS EMR 任務節點上的 Flink 管道部署時在 AWS EMR 集群上自動提交 Flink 作業的推薦方法是什么 EMR上的Flink作業僅在一個TaskManager上運行 AWS EMR - Apache Flink Web 客戶端

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM