簡體 English 中英

大量讀取期間 kafka 磁盤 hault 寫入並導致 kafka 生產者中的“隊列已滿”錯誤

[英]kafka disks hault writes during massive reads and cause “queue full” errors in the kafka producer

原文 2020-02-27 11:12:37 4 1 apache-kafka/ spark-streaming/ raid/ sched-deadline

我們有 6 個具有 256GB RAM、24c/48T 的 kafka 代理，它們托管在 raid10 中配置的 20 個 1.8TB SAS 10K rpm 磁盤。

有兩個火花流應用程序

每 10 分鍾開始他們的批次
一旦他們開始，他們的第一份工作就是閱讀同一個 kafka 主題。
該主題有 200 個分區，均勻分布在 6 個代理上（每個代理上有 33 個分區）。
流媒體應用程序使用 kafka 客戶端 0.8.2.1 從 kafka 消費

有 21 個注入器實例以 6K 事件/秒的速率連續寫入該主題。 他們使用 librdkafka poroducer 來向 kafka 生成事件。

當流媒體應用程序醒來時，他們的第一份工作是閱讀主題。 一旦這樣做，kafka 磁盤中的 %util 將在 30 秒到 60 秒內變為 90-100%，同時所有注入器實例都從它們的 kafka 生產者那里得到“隊列已滿”錯誤。 這是生產者配置：

queue.buffering.max.kbytes：2097151
逗留時間：0.5

從該圖中看不到，但是在 util% 高的時候，有一段時間寫入為 0，我們假設在這些時間注入器的生產者的隊列已滿，因此拋出“隊列已滿”錯誤。

值得一提的是，我們在kafka機器中使用deadline IO調度器，它優先考慮讀取操作。

關於如何釋放寫的壓力，我們有幾個想法：

減少不必要的 iops - 將 kafka 磁盤配置從 raid10 更改為非raid（“jbod”）
傳播閱讀 - 使 Spark 應用程序在不同時間從 kafka 讀取，而不是在同一時間醒來
更改寫入和讀取的優先級 - 將 IO 調度程序更改為 CFQ

我寫這個問題是為了驗證我們是否在正確的軌道上，並且由於 raid10、截止時間 IO 調度程序和同時讀取過多，操作系統 hault 在讀取期間確實寫入。

你怎么看？

1 個解決方案

當你問這是否朝着正確的方向發展時：

我認為你提到的步驟是有道理的。

一般來說，我總是建議不要讓任何東西占用 100% 的磁盤容量，如果它必須與其他假設它們有一些 IO 可用的東西共享這些磁盤。

卡夫卡流應用程序從寫入中分開讀取

[英]Kafka streams app seperate reads from writes

即使未調用生產者提交，Kafka 事務性生產者也會寫入消息

[英]Kafka transactional producer writes messages even if producer commit in not invoked

使用隊列實現 Kafka 生產者消費者聊天

[英]Implement Kafka Producer Consumer Chat with Queue

如何優雅地處理 apache kafka producer 中的錯誤

[英]How to gracefully handle errors in apache kafka producer

卡夫卡生產者在運行期間拋出EOFException

[英]kafka producer throw EOFException during running

Kafka 節點高級生產者僅寫入偶數分區

[英]Kafka Node High Level Producer writes to even partitions only

如何創建從一個主題讀取並寫入另一個主題的 Kafka Stream

[英]How to create Kafka Stream that reads from one topic and writes to another

Intellij Idea 上的 Kafka 生產者給出語法錯誤

[英]Kafka producer on Intellij Idea giving syntax errors

Kafka Connect 與自定義 Kafka Producer

[英]Kafka Connect with custom Kafka Producer

卡夫卡生產者與卡夫卡連接器

[英]Kafka Producer vs Kafka Connector

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 卡夫卡流應用程序從寫入中分開讀取即使未調用生產者提交，Kafka 事務性生產者也會寫入消息使用隊列實現 Kafka 生產者消費者聊天如何優雅地處理 apache kafka producer 中的錯誤卡夫卡生產者在運行期間拋出EOFException Kafka 節點高級生產者僅寫入偶數分區如何創建從一個主題讀取並寫入另一個主題的 Kafka Stream Intellij Idea 上的 Kafka 生產者給出語法錯誤 Kafka Connect 與自定義 Kafka Producer 卡夫卡生產者與卡夫卡連接器

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM