![](/img/trans.png)
[英]should I pre-install cran r packages on worker nodes when using sparkr
[英]Using CRAN packages inside SparkR
如果我想在SparkR中使用像MXNet這樣的標准R軟件包,這可能嗎? 可以在Spark分布式環境中使用標准CRAN包,而無需考慮本地與Spark Dataframe。 處理R和Spark中的大型數據集的策略是使用Spark數據幀,減少Dataframe,然后將其轉換為本地data.frame以使用標准CRAN包嗎? 還有其他我不了解的策略嗎?
謝謝
可以在Spark分布式環境中使用標准CRAN包,而無需考慮本地與Spark Dataframe。
不,他們不能。
處理R和Spark中的大型數據集的策略是使用Spark數據幀,減少Dataframe,然后將其轉換為本地
data.frame
。
可悲的是,大部分時間這都是你做的。
還有其他我不了解的策略嗎?
Spark 2.0中的dapply
和gapply
函數可以將任意R代碼應用於分區或組。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.