如何計算 Pandas 中另一列分組的平均值

Question

對於以下數據框：

StationID  HoursAhead    BiasTemp  
SS0279           0          10
SS0279           1          20
KEOPS            0          0
KEOPS            1          5
BB               0          5
BB               1          5

我想得到類似的東西：

StationID  BiasTemp  
SS0279     15
KEOPS      2.5
BB         5

我知道我可以編寫這樣的腳本以獲得所需的結果：

def transform_DF(old_df,col):
    list_stations = list(set(old_df['StationID'].values.tolist()))
    header = list(old_df.columns.values)
    header.remove(col)
    header_new = header
    new_df = pandas.DataFrame(columns = header_new)
    for i,station in enumerate(list_stations):
        general_results = old_df[(old_df['StationID'] == station)].describe()
        new_row = []
        for column in header_new:
            if column in ['StationID']: 
                new_row.append(station)
                continue
            new_row.append(general_results[column]['mean'])
        new_df.loc[i] = new_row
    return new_df

但我想知道大熊貓是否有更直接的東西。

Answer 1

你可以groupby上StationID然后取mean()上BiasTemp 。 要輸出Dataframe ，請使用as_index=False

In [4]: df.groupby('StationID', as_index=False)['BiasTemp'].mean()
Out[4]:
  StationID  BiasTemp
0        BB       5.0
1     KEOPS       2.5
2    SS0279      15.0

如果沒有as_index=False ，它會返回一個Series

In [5]: df.groupby('StationID')['BiasTemp'].mean()
Out[5]:
StationID
BB            5.0
KEOPS         2.5
SS0279       15.0
Name: BiasTemp, dtype: float64

在這個 pydata教程中閱讀更多關於groupby 。

Answer 2

這就是groupby的用途：

In [117]:
df.groupby('StationID')['BiasTemp'].mean()

Out[117]:
StationID
BB         5.0
KEOPS      2.5
SS0279    15.0
Name: BiasTemp, dtype: float64

在這里，我們按“StationID”列進行分組，然后訪問“BiasTemp”列並對其調用mean

文檔中有關於此功能的部分。

Answer 3

可以按如下方式完成：

df.groupby('StationID').mean()

如何計算 Pandas 中另一列分組的平均值

問題描述

3 個解決方案

解決方案1
94 已采納 2015-05-27 12:16:19

解決方案2
11 2015-05-27 12:13:48

解決方案3
1 2020-08-17 04:43:09

如何計算 Pandas 中另一列分組的平均值

問題描述

3 個解決方案

解決方案1 94 已采納 2015-05-27 12:16:19

解決方案2 11 2015-05-27 12:13:48

解決方案3 1 2020-08-17 04:43:09

解決方案1
94 已采納 2015-05-27 12:16:19

解決方案2
11 2015-05-27 12:13:48

解決方案3
1 2020-08-17 04:43:09