在 pandas dataframe 中創建列

Question

我有一個 dataframe 如下：

df = pd.DataFrame({'ORDER':["A", "A", "A", "B", "B","B"], 'GROUP': ["A1C", "A1", "B1", "B1C", "M1", "M1C"]})
df['_A1_XYZ'] = 1
df['_A1C_XYZ'] = 2
df['_B1_XYZ'] = 3
df['_B1C_XYZ'] = 4
df['_M1_XYZ'] = 5
df

    ORDER   GROUP   _A1_XYZ   _A1C_XYZ   _B1_XYZ      _B1C_XYZ  _M1_XYZ
0   A       A1C      1          2             3       4          5     
1   A       A1       1          2             3       4          5     
2   A       B1       1          2             3       4          5     
3   B       B1C      1          2             3       4          5     
4   B       M1       1          2             3       4          5     
5   B       M1C      1          2             3       4          5

我想根據列“GROUP”和所有以XYZ 結尾的列創建一個列“NEW”，如下所示：基於每行 df["NEW"] = df["_XYZ"] 的 GROUP 值。

例如，對於第一行，GROUP = A1C，所以“NEW”= 2 (_A1C_XYZ)，類似地對於第二行“NEW” = 1 (_A1_XYZ)

我的預期 output

    ORDER   GROUP   _A1_XYZ   _A1C_XYZ   _B1_XYZ      _B1C_XYZ  _M1_XYZ      NEW
0   A       A1C      1          2             3       4          5           2
1   A       A1       1          2             3       4          5           1
2   A       B1       1          2             3       4          5           3
3   B       B1C      1          2             3       4          5           4
4   B       M1       1          2             3       4          5           5
5   B       M1C      1          2             3       4          5

Answer 1

使用pd.DataFrame.lookup ：

df['NEW'] = df.lookup(df.index, '_'+df['GROUP']+'_XYZ')
df

Output：

  ORDER GROUP  _A1_XYZ  _A1C_XYZ  _B1_XYZ  _B1C_XYZ  _M1_XYZ  _M1C_XYZ  NEW
0     A   A1C        1         2        3         4        5         6    2
1     A    A1        1         2        3         4        5         6    1
2     A    B1        1         2        3         4        5         6    3
3     B   B1C        1         2        3         4        5         6    4
4     B    M1        1         2        3         4        5         6    5
5     B   M1C        1         2        3         4        5         6    6

問題編輯后更新。

或者使用堆棧和重新索引，

(df['New'] = df.stack().reindex(zip(df.index, '_'+dfl['GROUP']+'_XYZ'))
               .rename('NEW').reset_index(level=1, drop=True))

df

Output：

  ORDER GROUP  _A1_XYZ  _A1C_XYZ  _B1_XYZ  _B1C_XYZ  _M1_XYZ  New
0     A   A1C        1         2        3         4        5    2
1     A    A1        1         2        3         4        5    1
2     A    B1        1         2        3         4        5    3
3     B   B1C        1         2        3         4        5    4
4     B    M1        1         2        3         4        5    5
5     B   M1C        1         2        3         4        5  NaN

Answer 2

如果行中的所有值也是列，@ScottBoston 的答案會更好，但我想我會分享我的，本質上，我用相關列創建一個新的 dataframe，刪除重復項，更改列名。 轉置 dataframe 並將列合並回...

a = df.iloc[:,2:].drop_duplicates()
a.columns = [col.split('_')[1] for col in df.columns if '_' in col]
a = a.T.rename({0:'NEW'}, axis=1)
df = pd.merge(df, a, how='left', left_on='GROUP', right_index=True)
df

output：

ORDER   GROUP   _A1_XYZ _A1C_XYZ    _B1_XYZ _B1C_XYZ    _M1_XYZ  NEW
0   A   A1C     1       2           3       4           5        2.0
1   A   A1      1       2           3       4           5        1.0
2   A   B1      1       2           3       4           5        3.0
3   B   B1C     1       2           3       4           5        4.0
4   B   M1      1       2           3       4           5        5.0
5   B   M1C     1       2           3       4           5        NaN

在 pandas dataframe 中創建列

問題描述

2 個解決方案

解決方案1
1 已采納 2020-07-09 18:40:23

問題編輯后更新。

解決方案2
0 2020-07-09 18:55:23

在 pandas dataframe 中創建列

問題描述

2 個解決方案

解決方案1 1 已采納 2020-07-09 18:40:23

問題編輯后更新。

解決方案2 0 2020-07-09 18:55:23

解決方案1
1 已采納 2020-07-09 18:40:23

解決方案2
0 2020-07-09 18:55:23