[英]Spark DataFrame orderBy and DataFrameWriter sortBy, is there a difference?
[英]typsafe sortBy/orderBy on Spark Dataset
鉴于以下工作正常:
myDF.as[MyCaseClass].sort("process_utc_sec")
我怎样才能做一个更类型安全的方式,比如:
myDF.as[MyCaseClass].sortBy(_.process_utc_sec)
干杯
您可以将您的数据集转换为 RDD 并在此 RDD 上调用sortBy
。 然后转换回数据集:
myDF.as[MyCaseClass].rdd.sortBy(_.process_utc.sec).toDS()
但是sortWithinPartition
方法没有任何替代方法......
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.