繁体   English   中英

在Scala中对数据集[String]排序

[英]Sort a Dataset[String] in Scala

我有dsString: Dataset[(String,Long)] (无DataFrame或Dataset [Row]),我正在尝试按Long排序.orderBy(_._2)

我的问题是.orderBy().sort()仅接受列,而我只能对.sortBy使用.sortBy。

DataFrame解决方案

dsString.toDF("a", "b")
  .groupBy("b")

RDD解决方案:

 dsString.toJavaRDD
    .sortBy(_._2)

Dataset[(String,Long)]怎么做?

数据集也可以按订单应用。 例如,

+---+---+
| _1| _2|
+---+---+
|  c|  3|
|  b|  5|
|  a|  4|
+---+---+

这是我的数据集,

df2.orderBy(col("_1").desc).show
df2.orderBy(col("_2").asc).show

给出如下结果:

+---+---+
| _1| _2|
+---+---+
|  c|  3|
|  b|  5|
|  a|  4|
+---+---+


+---+---+
| _1| _2|
+---+---+
|  c|  3|
|  a|  4|
|  b|  5|
+---+---+

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM