簡體   English   中英

使用以SparkSession實例開頭的spark應用程序鏈接crunch spark管道

[英]Link crunch spark pipeline with spark application beginning with SparkSession instance

Crunch管道可以將Java spark context作為參數,但是如果spark應用程序以SparkSession實例啟動(因為spark Java程序包含Datasets並且需要sparkSQL)。 在這種情況下,如何在spark應用程序中添加另一層抽象(crunch管道)?

可能你對概念有誤解。 crunch中的spark管道本質上是讓Crunch在Spark Engine中運行你的代碼而不是MapReduce引擎。 與MapReduce作業和Spark管道相比,Apache Crunch(PCollections)的抽象是一種高級抽象。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM