繁体   English   中英

在 Pandas DataFrame 中查找具有每天最小值/最大值的行

[英]Find row with min/max value for each day in Pandas DataFrame

我有一个 dataframe ,其中包含多天数据(为简洁起见,此处仅显示一天):

                       Charge
2022-01-03 13:19:02    99.5
2022-01-03 13:20:03    95.0
2022-01-03 13:21:02    64.2
2022-01-03 13:22:02    91.8
2022-01-03 13:23:02    99.5

我希望能够找到具有最小值和最大值的行,以便我可以获得最小和最大充电的确切时间。 如果有多个,我只会 select 第一次出现。 IE:

                       Charge
2022-01-03 13:19:02    99.5
2022-01-03 13:21:02    64.2

我试过使用:

df_bat_chrg_min = df['Battery State of Charge'].groupby(df.index.day).min()
df_bat_chrg_max = df['Battery State of Charge'].groupby(df.index.day).max()
df_bat_chrg = pd.merge(df_bat_chrg_max, df_bat_chrg_min, left_index=True, right_index=True)

这会产生:

            Max Charge  Min Charge
2022-01-03  100.0       96.5

但是,索引名称不包括事件的确切时间,如第二个代码块所示。

使用DataFrameGroupBy.idxmaxDataFrameGroupBy.idxmin按最小值和最大值进行索引,通过DataFrame.loc转换为Series和 select 原始DatetimeIndex

df1 = (df.loc[df.groupby(df.index.day)['Charge']
               .agg(['idxmin', 'idxmax']).stack()].sort_index())
print (df1)
                     Charge
2022-01-03 13:19:02    99.5
2022-01-03 13:21:02    64.2

如果需要聚合新列:

df2 = df.groupby(df.index.day)['Charge'].agg(['min','max', 'idxmin', 'idxmax'])
print (df2)
    min   max              idxmin              idxmax
3  64.2  99.5 2022-01-03 13:21:02 2022-01-03 13:19:02

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM