繁体   English   中英

Spark是否处理数据改组?

[英]Does spark handle data shuffling?

我有我转换成整个集群的RDD X传播所输入音频。

我对其执行某些操作。

然后在输出rdd上执行.repartition(1)

我的输出rdd与输入A的顺序相同吗?

Spark会自动处理吗? 如果是,那怎么办?

文档不保证将保留订单,因此您可以假设不会保留。 如果您看一下实现,您肯定会发现它不会(除非出于某种原因您的原始RDD已经具有1个分区): repartition调用coalesce(shuffle = true) ,这

从随机分区开始,在输出分区之间均匀分配元素。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM