繁体 English 中英

在Spark RDD上使用本机Scala方法是否会失去Spark魔术功能？

[英]Does using native Scala methods on Spark RDD's lose out on Spark magic?

原文 2017-12-11 14:06:28 7 1 scala/ apache-spark/ rdd

我正在研究Spark，但对Spark如何处理某些问题有疑问。

假设我有一个键->值对的RDD ：（客户ID，TotalSpend）。 如果我在RDD上使用.sortBy，由于.sortBy是Scala方法而不是Spark方法，我会错过Spark Magic吗？

换句话说，要从Spark所做的分发中受益，您只能在RDD上使用Spark方法吗？ 我已经看到了一些示例，人们希望这样做：rdd.sortBy（x => x._2），但是相反，他们将首先映射rdd来反转元组成员，然后使用rdd.reduceByKey（）。

RDD.sortBy ，与RDD相关的所有其他操作都来自Spark，它不属于Scala标准库。 由于RDD的整个概念都来自Spark，因此没有适用于RDD的标准Scala方法。

[英]Nesting of RDD's in Scala Spark

[英]Scala Spark - using RDD with mllib

[英]Filter RDD's csv with JSON field using Spark/Scala

[英]Spark Scala Generating Random RDD with (1's and 0's )?

[英]On Spark's RDD's take and takeOrdered methods

[英]how to join 2 rdd's in spark scala

[英]Spark scala RDD traversing

[英]reduceByKey RDD spark scala

[英]Spark-Scala RDD

[英]Scala/Spark - Aggregating RDD

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Scala Spark中嵌套RDD Scala Spark-将RDD与mllib结合使用使用 Spark/Scala 过滤 RDD 的 csv 和 JSON 字段 Spark Scala用（1和0）生成随机RDD吗？关于 Spark 的 RDD 的 take 和 takeOrdered 方法如何在 spark scala 中加入 2 rdd Spark Scala RDD遍历 reduceByKey RDD 火花 scala Spark-Scala RDD Scala / Spark-聚合RDD

相关标签