![](/img/trans.png)
[英]spark python convert RDD tuple with nested tuples into sigle tuple
[英]Convert an RDD with list of unicode data to an RDD of tuples in Spark with Python
我有一个带有unicode
数据list
的RDD
,例如:
[[u'2002-03-31',u'emp1',u'20000'],[u'2002-05-11',u'emp2',u'23050'],[u'2002-05-17',u'emp1',u'23300']...]
我想用tuple
将其转换为RDD
,例如:
[(u'2002-03-31',u'emp1',u'20000'),(u'2002-05-11',u'emp2',u'23050'),(u'2002-05-17',u'emp1',u'23300')...]
如何做呢?
您可以简单地使用tuple
映射:
rdd = sc.parallelize([
[u'2002-03-31', u'emp1', u'20000'],
[u'2002-05-11', u'emp2', u'23050'],
[u'2002-05-17', u'emp1', u'23300']])
tuples = rdd.map(tuple)
tuples.first()
## ('2002-03-31', 'emp1', '20000')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.