簡體   English   中英

如何獲取失敗的 flink 作業的名稱

[英]How to get the name of failed flink jobs

我們的 flink 集群有時會重新啟動,所有作業都會重新啟動。 有時,某些作業無法重新啟動,並且面板上的失敗計數會增加。 但是,它無法讓我們知道哪些作業失敗了。

當總作業數增加時,找到停止的作業變得更加困難。 有誰知道我怎樣才能得到失敗工作的名字? 在此處輸入圖片說明

您可以為此編寫一個簡單的腳本,該腳本將為您提供失敗的作業名稱列表。

我正在使用此命令來獲取失敗作業的列表。

$yarn application -list -appStates KILLED

在集群重新啟動時設置警報並在重新啟動后檢查尚未重新啟動的作業,您也可以為這些作業發出警報。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM