[英]In Apache Spark, why does RDD.union not preserve the partitioner?
[英]In Apache Spark, Is there concatenate RDD instead of a union?
rdd.union()和++都通过消除RDD中的重复对象来实现并集。 我认为这是连接两个具有不同元素的RDD的昂贵方法。 有什么选择?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.