如何根據不同列中的值向 pandas dataframe 添加一列？

Question

我有一個 pandas 數據框，如下所示：

a     b    c    d   
0.7   0.1  0.2  0.3
0.5   0.2  0.2  0.2

我正在編寫一些像下面這樣的嵌套循環來添加基於這 4 列的列結果。

def class_decider(df):
    for i in df['a']:
        if i > 0.6:
            a = "class A"
        elif:
            for j in df['b']:
                if j > 0.2:
                    a = "class B"
                elif:
                    for k in df['c']:
                        if j > 0.15:
                            a = "class C"
                        elif:
                            for l in df['d']:
                                if l > 0.10:
                                    a = "class D"
                                else:
                                    a = "null"
    return a

任何人都可以幫助優化代碼。

預期 Output：

a     b    c    d     result
0.7   0.1  0.2  0.3   class A
0.5   0.2  0.2  0.2   class C

Answer 1

IIUC，您可以將列a 、 b 、 c和d與 0.6、0.2、0.15、0.10 進行比較0.6, 0.2, 0.15, 0.10以創建 boolean 掩碼，然后在此掩碼上沿axis=1使用idxmax以獲取第一個True值掩碼的名稱發生在掩碼中。

c = ['a', 'b', 'c', 'd']
m = df[c].gt([0.6, 0.2, 0.15, 0.10])
df['Result'] = m.idxmax(1).radd('Class ').mask(~m.any(1), 'Null')

     a    b    c    d   Result
0  0.7  0.1  0.2  0.3  Class a
1  0.5  0.2  0.2  0.2  Class c

Answer 2

如果您正在尋找可解釋、靈活但不一定性能最佳的解決方案，這里有兩種方法：

方法 1 ：使用.loc和列比較

df = pd.DataFrame({'a':[0.7, 0.5], 'b':[0.1, 0.2], 'c':[0.2, 0.2], 'd':[0.3, 0.2]})
df['result'] = None
df.loc[df['d'] > 0.1, 'result'] = 'class_d'
df.loc[df['c'] > 0.15, 'result'] = 'class_c'
df.loc[df['b'] > 0.2, 'result'] = 'class_b'
df.loc[df['a'] > 0.6, 'result'] = 'class_a'

方法 2使用df.iterrows()

df = pd.DataFrame({'a':[0.7, 0.5], 'b':[0.1, 0.2], 'c':[0.2, 0.2], 'd':[0.3, 0.2]})
df['result'] = None

for idx, row in df.iterrows():
    if row['a'] > 0.6:
        df.loc[idx, 'result'] = 'class_a'
    elif row['b'] > 0.2:
        df.loc[idx, 'result'] = 'class_b'
    elif row['c'] > 0.15:
        df.loc[idx, 'result'] = 'class_c'
    elif row['d'] > 0.1:
        df.loc[idx, 'result'] = 'class_d'

如何根據不同列中的值向 pandas dataframe 添加一列？

問題描述

2 個解決方案

解決方案1
5 已采納 2021-03-22 17:47:29

解決方案2
0 2021-03-22 18:17:48

如何根據不同列中的值向 pandas dataframe 添加一列？

問題描述

2 個解決方案

解決方案1 5 已采納 2021-03-22 17:47:29

解決方案2 0 2021-03-22 18:17:48

解決方案1
5 已采納 2021-03-22 17:47:29

解決方案2
0 2021-03-22 18:17:48