[英]Sort a Dataset[String] in Scala
我有dsString: Dataset[(String,Long)]
(无DataFrame或Dataset [Row]),我正在尝试按Long排序.orderBy(_._2)
我的问题是.orderBy()
和.sort()
仅接受列,而我只能对.sortBy
使用.sortBy。
DataFrame解决方案
dsString.toDF("a", "b")
.groupBy("b")
RDD解决方案:
dsString.toJavaRDD
.sortBy(_._2)
Dataset[(String,Long)]
怎么做?
数据集也可以按订单应用。 例如,
+---+---+
| _1| _2|
+---+---+
| c| 3|
| b| 5|
| a| 4|
+---+---+
这是我的数据集,
df2.orderBy(col("_1").desc).show
df2.orderBy(col("_2").asc).show
给出如下结果:
+---+---+
| _1| _2|
+---+---+
| c| 3|
| b| 5|
| a| 4|
+---+---+
+---+---+
| _1| _2|
+---+---+
| c| 3|
| a| 4|
| b| 5|
+---+---+
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.