簡體   English   中英

Spark SQL在使用Java創建的兩個RDD上聯接

[英]Spark SQL join on two RDDs created using java

我創建了兩個RDD,並使用java對其進行了持久化。 我已將罐子交給火花大師。 現在,當spark shell提示我輸入查詢時,我已經在兩個RDD上給出了一條SQL語句連接條件。 然后在結果集上執行collect()時會引發異常。

JOIN條件:從TABLE_1中選擇一個ID作為JOIN TABLE_2。b ON a.NAME = b.NAME;

異常:resultSet.collect()上的空指針異常

PS:我在resultSet.collect()之前檢查了結果集是否為null; 但仍然進入條件並引發NPE。 我正在使用spark-sql-1.1.1 jar(最新)。

SPARK SQL中的JOIN是否有問題?

看起來Java Spark API的某些JOIN操作有問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM