繁体 English 中英

在 pyspark 中创建 rdd 的 rdd

[英]create rdd of rdd in pyspark

原文 2019-11-17 11:01:59 0 2 python/ apache-spark/ pyspark/ rdd

是否可以在 pyspark 中创建 rdd 的 rdd？ 我试过了

rdd1=sc.parallelize([1,2,3])
rdd2=sc.parallelize([4,5,6])
rdd3=sc.parallelize([rdd1,rdd2])

并得到错误

2 个解决方案

UNION方法可用于执行此操作

rdd1 = sc.parallelize([1, 2, 3])
rdd2 = sc.parallelize([4, 5, 6])
rdd3 = sc.parallelize([7, 8, 9])

rdd = sc.union([rdd1, rdd2, rdd3])
rdd.collect()

## [1, 2, 3, 4, 5, 6, 7, 8, 9]

作为旁注，现在建议使用DataFrame或Dataset API。

你可以加入2个RDD

rdd1.join(rdd2)

使用 RDD 在 PySpark 中创建 dataframe

[英]Create a dataframe in PySpark using RDD

如何从pyspark中的列表创建一行rdd

[英]How to create a row rdd from a list in pyspark

Pyspark：为对RDD中的每个键创建直方图

[英]Pyspark: Create histogram for each key in Pair RDD

如何从PySpark中的RDD创建数据框？

[英]How to create a dataframe from a RDD in PySpark?

通过在pyspark中使用RDD从字典创建数据框

[英]create a dataframe from dictionary by using RDD in pyspark

如何删除元素，如何从一个rdd的其他rdd删除elemts并在pyspark中创建新的rdd？

[英]How to remove elements how to delete elemts from one rdd based on other rdd and create new rdd in pyspark?

Pyspark CSV 到 RDD 到 CoordinateMatrix

[英]Pyspark CSV to RDD to CoordinateMatrix

PySpark相当于Flatmapgroups RDD

[英]PySpark equivalent of Flatmapgroups RDD

Pyspark将RDD保存到Cassandra

[英]Pyspark save RDD to Cassandra

如何在pyspark中标准化RDD？

[英]How to standardize an RDD in pyspark?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 RDD 在 PySpark 中创建 dataframe 如何从pyspark中的列表创建一行rdd Pyspark：为对RDD中的每个键创建直方图如何从PySpark中的RDD创建数据框？通过在pyspark中使用RDD从字典创建数据框如何删除元素，如何从一个rdd的其他rdd删除elemts并在pyspark中创建新的rdd？ Pyspark CSV 到 RDD 到 CoordinateMatrix PySpark相当于Flatmapgroups RDD Pyspark将RDD保存到Cassandra 如何在pyspark中标准化RDD？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM