[英]join CassandraTableScanRDD[CassandraRow] with RDD[String]
我正在編寫一個程序,其中有一個RDD [String]和一個CassandraTableScanRDD,我想在它們之間進行左連接。
這可能嗎? 從網上看到的結果來看,聯接只是在CassandraTableScanRDD之間進行。
join
函數可用於PairRDD
對象(請參見此處 )。
PairRDD
對象是鍵值對的RDD,例如: RDD[(Int, String)]
通常,您創建一個PairRDD
從一個普通對象RDD
使用keyBy
功能,它允許您指定要使用的關鍵。 然后,當您運行join
,它將聯接鍵相等的元素。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.