java.lang.ClassCastException: org.apache.spark.sql.Column cannot be cast to scala.collection.Seq

Question

I am performing something like this for using right join in the spark application in java.

Dataset<Row> dataset3 = dataset1.join(dataset2, 
       (Seq<String>) dataset1.col("target_guid"),RightOuter.sql());

But getting this error

java.lang.ClassCastException: org.apache.spark.sql.Column cannot be 
cast to scala.collection.Seq

Other than this, I couldn't find the way to use joins in java for the datasets. Could anyone help me finding a way to do this?

Answer 1

Can change your code to something like this,

Dataset<Row> dataset3 = dataset1.as("dataset1").join(dataset2.as("dataset2"),
                dataset1.col("target_guid").equalTo(dataset2.col("target_guid")), RightOuter.sql());

Answer 2

If you wanted to use below dataset api in java-

 def join(right: Dataset[_], usingColumns: Seq[String], joinType: String): DataFrame

then convert the string list into seq. Please keep below method handy to convert java list to scala seq as most of the spark apis accept scala seq

import scala.collection.JavaConversions;
<T> Buffer<T> toScalaSeq(List<T> list) {
        return JavaConversions.asScalaBuffer(list);
    }

Also you can't use joinType as RightOuter.sql() which evaluates to 'RIGHT OUTER' . The supported join types includes -

'inner', 'outer', 'full', 'fullouter', 'full_outer', 'leftouter', 'left', 'left_outer', 'rightouter', 'right', 'right_outer', 'leftsemi', 'left_semi', 'leftanti', 'left_anti', 'cross'

Now you can use-

Dataset<Row> dataset3 = dataset1.join(dataset2,
                toScalaSeq(Arrays.asList("target_guid")), "rightouter");

java.lang.ClassCastException: org.apache.spark.sql.Column cannot be cast to scala.collection.Seq

Question

2 answers

solution1
0 2020-05-28 04:59:27

solution2
0 ACCPTED 2020-05-28 06:06:24

java.lang.ClassCastException: org.apache.spark.sql.Column cannot be cast to scala.collection.Seq

Question

2 answers

solution1 0 2020-05-28 04:59:27

solution2 0 ACCPTED 2020-05-28 06:06:24

solution1
0 2020-05-28 04:59:27

solution2
0 ACCPTED 2020-05-28 06:06:24