簡體 English 中英

任務管理器失敗后的 Flink-RocksDB 行為

[英]Flink-RocksDB behaviour after task manager failure

原文 2021-04-01 20:29:50 0 1 apache-flink/ rocksdb

我正在嘗試使用 RocksDB 作為 State 后端的新 Flink 集群（3 個不同的機器-> 1 個作業管理器，2-> 任務管理器），但是我得到的檢查點行為有點令人困惑。

更具體地說，我設計了一個簡單的 WordCount 示例，我的數據源是 netcat。 當我提交我的工作時，工作管理器將它分配給一個隨機的任務管理器（也沒有復制）。 我提供了一些話，然后我殺死了當前正在運行的任務管理器。 過了一會兒，作業在另一個任務管理器中重新啟動，我可以提供一些新詞。 令人困惑的部分是，即使我殺死了第一個任務管理器中的 state，它也會被保留。

據我了解，RocksDB 將其 state 維護在正在運行的任務管理器的本地目錄中，所以我所期望的是當第一個任務管理器被殺死時會丟失整個 state 並從頭開始計算單詞。 所以 Flink 似乎以某種方式在內存中維護其 state（？）或通過 JobManager 廣播它？

我錯過了什么嗎？

1 個解決方案

RocksDB state 后端確實將其工作 state 保留在每個任務管理器的本地磁盤上，而檢查點通常存儲在分布式文件系統中。

如果您啟用了檢查點，則備用任務管理器能夠從最新的檢查點恢復 state 並恢復處理。

Flink作業創建RocksDB實例失敗

[英]Flink job create RocksDB instance failure

Flink 任務管理器超時

[英]Flink Task Manager timeout

Flink 中的任務管理器親和力

[英]Task Manager Affinity in Flink

使用 Rocksdb 時 Flink ValueState 過期后會從存儲中移除？

[英]Flink ValueState will be removed from storage after expired when using Rocksdb?

[flink]任務管理器初始化失敗

[英][flink]Task manager initialization failed

Flink 任務管理器中的 slot 是什么？

[英]What is a slot in a Flink Task Manager?

Flink 任務管理器突然崩潰

[英]Flink Task Manager Suddenly Crashed

"flink 任務管理器無法在作業管理器中注冊"

[英]flink task manager could not register at job manager

Apache Flink - FsStateBackend - 在任務管理器失敗的情況下如何恢復狀態，將狀態存儲在其本地文件系統中

[英]Apache Flink - FsStateBackend - How state is recovered in case of Task Manager failure which stores state in its local file system

Flink Yarn 在任務失敗時無限重啟

[英]Flink Yarn infinite restart on task failure

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Flink作業創建RocksDB實例失敗 Flink 任務管理器超時 Flink 中的任務管理器親和力使用 Rocksdb 時 Flink ValueState 過期后會從存儲中移除？ [flink]任務管理器初始化失敗 Flink 任務管理器中的 slot 是什么？ Flink 任務管理器突然崩潰 "flink 任務管理器無法在作業管理器中注冊" Apache Flink - FsStateBackend - 在任務管理器失敗的情況下如何恢復狀態，將狀態存儲在其本地文件系統中 Flink Yarn 在任務失敗時無限重啟

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM