[英]join CassandraTableScanRDD[CassandraRow] with RDD[String]
我正在编写一个程序,其中有一个RDD [String]和一个CassandraTableScanRDD,我想在它们之间进行左连接。
这可能吗? 从网上看到的结果来看,联接只是在CassandraTableScanRDD之间进行。
join
函数可用于PairRDD
对象(请参见此处 )。
PairRDD
对象是键值对的RDD,例如: RDD[(Int, String)]
通常,您创建一个PairRDD
从一个普通对象RDD
使用keyBy
功能,它允许您指定要使用的关键。 然后,当您运行join
,它将联接键相等的元素。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.