繁体   English   中英

dask 创建组合列以模拟按 2 列排序

[英]dask create combined column to simulate sort by 2 columns

目前df.sort_values 在 dask只接受按 1 列排序。

我有一个具有这种结构的大文件

输入数据

我不知道如何先按整数列然后按日期对数据进行排序

  • 2000 年 1 月 1 日; 43000
  • 2000 年 1 月 2 日; 43000
  • 2000 年 1 月 1 日; 25000
  • 2000 年 1 月 2 日; 25000

我认为创建一个组合列并对其进行排序将是最好的选择。 问题是我不知道如何创建一个列来完成这个。也许还有另一种选择来做到这一点而不在 Dask 中创建一个组合列......

谢谢!

假设index == 2列中的整数和index == 1列中的日期:

df.sort_values([df.columns[2],df.columns[1]],ascending=(False,True))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM