繁体   English   中英

使用Java在Spark DataFrame中两列的区别

[英]difference of two columns in spark dataframe using java

我尝试了以下文章中提到的选项,但在Java中不起作用- 在spark数据框中找到两列的区别,并将其追加到新列中

在spark数据帧中减去两列为空的列

请让我知道如何使用Java中的Spark查找数据集的两列之间的差异。

通过使用sql方式减去两个列值来解决此问题。

sqlContext.sql("Select col1, sum(col2)-sum(col3) as resCol from temp group by col1") 

您可以采用另一种方式。 让我们假设,您想要具有区别的其他列:

Dataset<Row> ds = // your dataset
ds.withColumn("diff_col", new Column("col1").$minus(new Column("col2"));

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM