計算pandas數據幀中非數字列的每日出現次數

Question

我有這個人。 dataframe（每小時時間戳索引）：

                      relative_humidity                 condition   fid
2017-08-02 10:00:00               0.49  Chance of a Thunderstorm     1
2017-08-02 11:00:00               0.50  Chance of a Thunderstorm     1
2017-08-02 12:00:00               0.54             Partly Cloudy     1
2017-08-02 13:00:00               0.58             Partly Cloudy     2
2017-08-02 14:00:00               0.68             Partly Cloudy     2

如何計算每天最常出現的情況，並將其放在以日期為索引的數據框中。 還需要通過fid分開？

我試過了：

df.groupby(['fid', pd.Grouper(freq='D')])['condition']

Answer 1

您需要index[0] value_counts ，因為數據已排序且第一個值為top：

d = {'level_1':'date'}
df1 = df.groupby(['fid', pd.Grouper(freq='D')])['condition'] \
       .apply(lambda x: x.value_counts().index[0]).reset_index().rename(columns=d)
print (df1)
   fid       date                 condition
0    1 2017-08-02  Chance of a Thunderstorm
1    2 2017-08-02             Partly Cloudy

Answer 2

df.groupby(['fid',pd.Grouper(freq='D'),'condition']).size().groupby(level=[0,1]).head(1)

輸出：

fid              condition               
1    2017-08-02  Chance of a Thunderstorm    2
2    2017-08-02  Partly Cloudy               2
dtype: int64

計算pandas數據幀中非數字列的每日出現次數

問題描述

2 個解決方案

解決方案1
2 已采納 2017-08-02 13:17:26

解決方案2
1 2017-08-02 13:28:56

計算pandas數據幀中非數字列的每日出現次數

問題描述

2 個解決方案

解決方案1 2 已采納 2017-08-02 13:17:26

解決方案2 1 2017-08-02 13:28:56

解決方案1
2 已采納 2017-08-02 13:17:26

解決方案2
1 2017-08-02 13:28:56