熊貓，如何使用多個分組列替換python數據框中的平均值

Question

使用多個分組的列將數據框值替換為均值。 下面的快照是數據幀：

    Current Loan Amount DateTime    Day Month   Year
0   611314  1-Jan-92    1   Jan 92
1   266662  2-Jan-92    2   Jan 92
2   153494  3-Jan-92    3   Jan 92
3   176242  4-Jan-92    4   Jan 92
4   321992  5-Jan-92    5   Jan 92
5   202928  6-Jan-92    6   Jan 92
6   621786  7-Jan-92    7   Jan 92
7   266794  8-Jan-92    8   Jan 92
8   202466  9-Jan-92    9   Jan 92
9   266288  10-Jan-92   10  Jan 92
10  121110  11-Jan-92   11  Jan 92
11  258104  12-Jan-92   12  Jan 92
12  161722  13-Jan-92   13  Jan 92
13  753016  14-Jan-92   14  Jan 92
14  444664  15-Jan-92   15  Jan 92
15  172282  16-Jan-92   16  Jan 92
16  275440  17-Jan-92   17  Jan 92
17  218834  18-Jan-92   18  Jan 92
18  0   19-Jan-92   19  Jan 92
19  0   20-Jan-92   20  Jan 92

我需要用當年和當月的當前貸款金額的平均值替換0.0值。

我使用了不同的方法，下面的方法確實給出了平均值，但它不會更改數據框並刪除其余的列

data = data_loan.groupby(['Year','Month'])
def replace(group):
    mask = (group==0)
    group[mask] = group[~mask].mean()
    return group
new_data = data.transform(replace)

Answer 1

import numpy as np    
data_loan['current'] = data_loan['current'].replace(0, np.nan)    
data_loan["current"] = data_loan.groupby(['Month','Year'])["current"].transform(lambda x: x.fillna(x.mean()))

這將用組的均值替換0。

熊貓，如何使用多個分組列替換python數據框中的平均值

問題描述

1 個解決方案

解決方案1
1 已采納 2019-05-19 14:54:04

熊貓，如何使用多個分組列替換python數據框中的平均值

問題描述

1 個解決方案

解決方案1 1 已采納 2019-05-19 14:54:04

解決方案1
1 已采納 2019-05-19 14:54:04