繁体   English   中英

Pandas:按日期字符串对数据进行排序而不进行转换

[英]Pandas: Sort dataframe by date string without converting

拿这个简单的数据帧:

df = pd.DataFrame({
    'date':['1/15/2017', '2/15/2017','10/15/2016', '3/15/2017'], 
    'int':[2,3,1,4]
})

我想按日期排序,然后将其保存为CSV,而不必:

  1. 使用pd.to_datetime(df['date'])转换日期pd.to_datetime(df['date'])
  2. 使用.sort_values('date')对数据帧进行排序
  3. 将日期转换回.strftime('%-m/%-d/%Y')

而是做这样的事情(当然,这不起作用):

df.apply(pd.to_dataframe(df['date']).sort_values(by = 'date', inplace = True)

输出:

         date  kw
2  10/15/2016   1
0   1/15/2017   2
1   2/15/2017   3
3   3/15/2017   4

这是可能的,还是我应该坚持三步过程?

numpyargsort返回排序数组所需的排列。 我们可以利用iloc来利用iloc 因此,通过使用pd.to_datetime转换日期,然后获取值并调用argsort我们已经完成了对原始数据帧进行排序所需的所有操作,而无需更改任何列。

df.iloc[pd.to_datetime(df.date).values.argsort()]

         date  int
2  10/15/2016    1
0   1/15/2017    2
1   2/15/2017    3
3   3/15/2017    4

你可以使用.assign()方法:

In [22]: df.assign(x=pd.to_datetime(df['date'])).sort_values('x').drop('x', 1)
Out[22]:
         date  int
2  10/15/2016    1
0   1/15/2017    2
1   2/15/2017    3
3   3/15/2017    4

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM