熊猫，在保留订单的同时进行分类

Question

我收到了一个CSV文件，它是其他几个csv文件的组合。

它具有日期时间索引（格式为'2017-01-16'，年，月，日），但是会出现两个问题。

合并未按顺序进行。

  Date string number (different) 1 2017-01-16 stringvalue 90 2 2017-01-16 stringvalue 912 3 2017-01-16 stringvalue 29 4 2017-01-17 stringvalue 883 5 2017-01-17 stringvalue 223 6 2017-01-17 stringvalue 211 (...) 230 2015-04-30 stringvalue 908 231 2015-04-29 stringvalue 28 232 2015-04-29 stringvalue 9 233 2015-04-30 stringvalue 98 234 2015-04-30 stringvalue 909 (...) 450 2017-03-30 stringvalue 348

没有提供任何时间（实际的日期是最小的数字，但是每天都有大约10个值，需要保持顺序）

我通过执行解决了第一个问题

    df = df.reset_index()
    df = df.sort_values('Date')
    df = df.set_index('Date')

这样可以正确地对索引进行排序，但是会导致每天混乱。 有没有一种方法可以对日期进行排序，但在几天之内保持原始顺序不变？

Answer 1

通过使用新的para并为原始顺序添加前缀：

df['G']=df.groupby(level='Date').cumcount()
df
Out[125]: 
                 string  number  G
Date                              
2017-01-16  stringvalue      90  0
2017-01-16  stringvalue     912  1
2017-01-16  stringvalue      29  2
2017-01-17  stringvalue     883  0
2017-01-17  stringvalue     223  1
2017-01-17  stringvalue     211  2
2015-04-30  stringvalue     908  0
2017-03-30  stringvalue     348  0

df.sort_values('G').sort_index().drop('G',1)
Out[124]: 
                 string  number
Date                           
2015-04-30  stringvalue     908
2017-01-16  stringvalue      90
2017-01-16  stringvalue     912
2017-01-16  stringvalue      29
2017-01-17  stringvalue     883
2017-01-17  stringvalue     223
2017-01-17  stringvalue     211
2017-03-30  stringvalue     348

Answer 2

df['Date'] = pd.to_datetime(df.Date)

第一转换Date列datetime ，如果需要的类型

df = df.reset_index().sort_values(by=['Date', 'index']).drop(['index'], axis=1)

这将重置索引，并创建一个名为index的临时列。 然后使用“ Date和index列进行排序，最后删除index列。 使数据框按Date及其在原始CSV文件中的显示顺序进行排序。

熊猫，在保留订单的同时进行分类

问题描述

2 个解决方案

解决方案1
1 2018-01-02 19:57:31

解决方案2
1 已采纳 2018-01-02 20:04:42

熊猫，在保留订单的同时进行分类

问题描述

2 个解决方案

解决方案1 1 2018-01-02 19:57:31

解决方案2 1 已采纳 2018-01-02 20:04:42

解决方案1
1 2018-01-02 19:57:31

解决方案2
1 已采纳 2018-01-02 20:04:42