基於數據框的其他列創建一個新的熊貓數據框列

Question

我有一個包含 2 列的數據框：

'String' -> numpy 數組，如 [47, 0, 49, 12, 46]
“是等值線圖”-> 1 或 0

    String              Is Isogram
0   [47, 0, 49, 12, 46] 1
1   [43, 50, 22, 1, 13] 1
2   [10, 1, 24, 22, 16] 1
3   [2, 24, 3, 24, 51]  0
4   [40, 1, 41, 18, 3]  1

我想創建另一列，在 'String' 數組中附加值 'Is Isogram'，如下所示：

    String              Is Isogram  IsoString
0   [47, 0, 49, 12, 46] 1           [47, 0, 49, 12, 46, 1]
1   [43, 50, 22, 1, 13] 1           [43, 50, 22, 1, 13, 1]
2   [10, 1, 24, 22, 16] 1           [10, 1, 24, 22, 16, 1]
3   [2, 24, 3, 24, 51]  0           [2, 24, 3, 24, 51, 0]
4   [40, 1, 41, 18, 3]  1           [40, 1, 41, 18, 3, 1]

我已經嘗試使用帶有 lambda 的 apply 函數：

df[''IsoString] = df.apply(lambda x: np.append(x['String'].values, x['Is Isogram'].values, axis=1))

但它給我拋出了一個我不太理解的 KeyError

KeyError: ('String', 'occurred at index String')

我該如何解決這個問題？

Answer 1

有問題axis=1被調用np.append而不是.apply函數：

df['IsoString'] = df.apply(lambda x: np.append(x['String'], x['Is Isogram']), axis=1)

如果String中每個列表的長度相同，則使用numpy.hstack更好/更快：

arr = np.hstack((np.array(df['String'].tolist()), df['Is Isogram'].values[:, None]))
print (arr)
[[47  0 49 12 46  1]
 [43 50 22  1 13  1]
 [10  1 24 22 16  1]
 [ 2 24  3 24 51  0]
 [40  1 41 18  3  1]]

df['IsoString'] = arr.tolist()
print (df)
                String  Is Isogram               IsoString
0  [47, 0, 49, 12, 46]           1  [47, 0, 49, 12, 46, 1]
1  [43, 50, 22, 1, 13]           1  [43, 50, 22, 1, 13, 1]
2  [10, 1, 24, 22, 16]           1  [10, 1, 24, 22, 16, 1]
3   [2, 24, 3, 24, 51]           0   [2, 24, 3, 24, 51, 0]
4   [40, 1, 41, 18, 3]           1   [40, 1, 41, 18, 3, 1]

基於數據框的其他列創建一個新的熊貓數據框列

問題描述

1 個解決方案

解決方案1
3 已采納 2019-12-04 08:14:55

基於數據框的其他列創建一個新的熊貓數據框列

問題描述

1 個解決方案

解決方案1 3 已采納 2019-12-04 08:14:55

解決方案1
3 已采納 2019-12-04 08:14:55