根據 pandas 上另一列值的值創建一列

Question

我是 python 和 pandas 的新手，我遇到了一個問題

這是一個數據集

data = {'col1': ['a','b','a','c'], 'col2': [None,None,'a',None], 'col3': [None,'a',None,'b'], 'col4': ['a',None,'b',None], 'col5': ['b','c','c',None]}
df = pd.DataFrame(data)

我需要根據 col1 到 col4 的唯一值創建 3 列，每當 col1 或 col2 或 col3 或 col4 的值等於新列的 header 時，它應該返回 1，否則它應該返回 0

需要這樣的 output

數據集 output 示例：

data = {'col1': ['a','b','a','c'], 'col2': [None,None,'a',None], 'col3': [None,'a',None,'b'], 'col4': ['a',None,'b',None], 'col5': ['b','c','c',None], 'a':[1,1,1,0],'b':[0,1,1,1],'c':[0,1,1,1]}
df = pd.DataFrame(data)

我能夠使用下面的代碼創建一個新列並將其設置為 1

df['a'] = 0
df['a'] = (df['col1'] == 'a').astype(int)

但它只適用於第一列，我必須對所有列重復它。

有沒有辦法讓它同時發生在所有列上？

Answer 1

檢查pd.get_dummies和groupby

df = pd.concat([df,
                pd.get_dummies(df,prefix='',prefix_sep='').groupby(level=0,axis=1).max()],
                axis=1)
Out[377]: 
  col1  col2  col3  col4  col5  a  b  c
0    a  None  None     a     b  1  1  0
1    b  None     a  None     c  1  1  1
2    a     a  None     b     c  1  1  1
3    c  None     b  None  None  0  1  1

Answer 2

pd.concat([df, pd.get_dummies(df.stack().droplevel(1)).groupby(level=0).max()], axis=1)

結果：

   col1 col2    col3    col4    col5    a   b   c
0   a   None    None    a       b       1   1   0
1   b   None    a       None    c       1   1   1
2   a   a       None    b       c       1   1   1
3   c   None    b       None    None    0   1   1

根據 pandas 上另一列值的值創建一列

問題描述

2 個解決方案

解決方案1
1 已采納 2022-12-08 03:49:08

解決方案2
0 2022-12-08 04:00:01

根據 pandas 上另一列值的值創建一列

問題描述

2 個解決方案

解決方案1 1 已采納 2022-12-08 03:49:08

解決方案2 0 2022-12-08 04:00:01

解決方案1
1 已采納 2022-12-08 03:49:08

解決方案2
0 2022-12-08 04:00:01