根據其他列和計算創建一個新列

Question

這是我的數據框：df

ID AU 1 0 2 1 3 2 4 0 5 3 6 4 7 1 8 2 9 5 10 2 11 4 12 1 13 5 14 3

我想通過使用某些條件基於列“ AU”創建一個新列“得分”。 條件是：

如果“ AU” = 0，則“得分”將為0
如果0 <'AU'<= 4，則'得分'將為（1-AU）*（1-0.5）+0.5
如果'AU'> 4，'Score'為（1-AU）* 0.2 + 0.2

最后，預期結果是：

ID AU得分1 0 0 2 1 0,5 3 2 0 4 0 0 5 3 -0,5 6 4 -0,4 7 1 0,5 8 2 0 9 5 -0,6 10 2 0 11 4 -0 ，4 12 1 0,5 13 5 -0,6 14 3 -0,5

謝謝你的幫助。

Answer 1

在eval使用np.select

s1=(df.AU>0)&(df.AU<=4)
s2=df.AU>4
df['Score']=np.select([s1,s2],[df.eval('(1-AU)*(1-0.5)+0.5'),df.eval('(1-AU)*0.2+0.2')],default=0)
df
Out[136]: 
    ID  AU  Score
0    1   0    0.0
1    2   1    0.5
2    3   2    0.0
3    4   0    0.0
4    5   3   -0.5
5    6   4   -1.0
6    7   1    0.5
7    8   2    0.0
8    9   5   -0.6
9   10   2    0.0
10  11   4   -1.0
11  12   1    0.5
12  13   5   -0.6
13  14   3   -0.5

Answer 2

使用apply功能：

import pandas as pd

def computeScore(x):
    assert x >= 0
    if (x == 0):
        return 0
    elif ((x > 0) & (x <= 4)):
        return (1-x)*(1-0.5)+0.5
    return (1-x)*0.2+0.2

d = {'ID': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14],
     'AU': [0, 1, 2, 0, 3, 4, 1, 2, 5, 2, 4, 2, 5, 4]}
df = pd.DataFrame(data=d)

df["Score"] = pd.Series(df.AU).apply(computeScore)

API參考： https : //pandas.pydata.org/pandas-docs/version/0.17.0/genic/pandas.Series.apply.html

根據其他列和計算創建一個新列

問題描述

2 個解決方案

解決方案1
0 已采納 2019-01-14 23:23:33

解決方案2
0 2019-01-14 23:39:44

根據其他列和計算創建一個新列

問題描述

2 個解決方案

解決方案1 0 已采納 2019-01-14 23:23:33

解決方案2 0 2019-01-14 23:39:44

解決方案1
0 已采納 2019-01-14 23:23:33

解決方案2
0 2019-01-14 23:39:44