簡體 English 中英

Spark Streaming和高可用性

[英]Spark Streaming and High Availability

原文 2016-09-15 11:54:08 4 1 apache-spark/ spark-streaming/ high-availability

我正在構建作用於多個流的Apache Spark應用程序。

我確實閱讀了文檔的性能調優部分： http ： //spark.apache.org/docs/latest/streaming-programming-guide.html#performance-tuning

我沒有得到的是：

1）流媒體接收器是位於多個工作節點還是驅動程序機器？

2）如果接收數據的其中一個節點發生故障（斷電/重啟）會發生什么

1 個解決方案

流接收器是位於多個工作節點還是驅動程序機器

接收器位於工作節點上，工作節點負責消耗保存數據的源。

如果其中一個接收數據的節點出現故障（斷電/重啟）會發生什么

接收器位於工作節點上。 工作節點從驅動程序獲取它的任務。 如果您在客戶端模式下運行，則此驅動程序可以位於專用主服務器上;如果您在群集模式下運行，則該驅動程序可以位於其中一個工作服務器上。 如果節點發生故障並且未運行驅動程序，則驅動程序會將故障節點上保存的分區重新分配給另一個，然后可以從源重新讀取數據，並執行其他操作。從故障中恢復所需的處理。

這就是需要可重放源，如Kafka或AWS Kinesis的原因。

火花驅動器的高可用性

[英]high availability of spark driver

Spark 高可用性

[英]Spark High Availability

Apache Spark。 Spark客戶端的高可用性

[英]Apache Spark. High availability for spark client

kerberized Hadoop 環境中的 Spark 並啟用了高可用性：Spark SQL 只能在寫入任務后讀取數據

[英]Spark in kerberized Hadoop environment and High Availability enabled: Spark SQL can only read data after write task

Spark Streaming

[英]Spark Streaming

卡夫卡流或星火流

[英]kafka streaming or spark streaming

Spark Streaming：為什么內部處理成本如此之高以處理幾MB的用戶狀態？

[英]Spark Streaming: Why internal processing costs are so high to handle user state of a few MB?

檢查 Metastore 以了解 Spark 中的表可用性

[英]Check the Metastore for the Table availability in Spark

Spark 流式傳輸與結構化流式傳輸

[英]Spark Streaming vs Structured Streaming

Spark Streaming過濾流數據

[英]Spark Streaming Filtering the Streaming data

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 火花驅動器的高可用性 Spark 高可用性 Apache Spark。 Spark客戶端的高可用性 kerberized Hadoop 環境中的 Spark 並啟用了高可用性：Spark SQL 只能在寫入任務后讀取數據 Spark Streaming 卡夫卡流或星火流 Spark Streaming：為什么內部處理成本如此之高以處理幾MB的用戶狀態？檢查 Metastore 以了解 Spark 中的表可用性 Spark 流式傳輸與結構化流式傳輸 Spark Streaming過濾流數據

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM