對於Pandas數據框中的每一行，確定另一列中是否存在一列值

Question

我有一個這樣的熊貓數據框：

df = pd.DataFrame({'category' : ['A', 'B', 'C', 'A'], 'category_pred' : [['A'], ['B','D'], ['A','B','C'], ['D']]})
print(df)

  category category_pred
0        A           [A]
1        B        [B, D]
2        C     [A, B, C]
3        A           [D]

我想要這樣的輸出：

  category category_pred  count
0        A           [A]      1
1        B        [B, D]      1
2        C     [A, B, C]      1
3        A           [D]      0

也就是說，對於每一行，確定“ category”中的值是否出現在“ category_pred”中。 請注意，“ category_pred”可以包含多個值。

我可以像這樣做一個for循環，但這確實很慢。

for i in df.index:
    if df.category[i] in df.category_pred[i]:
        df['count'][i] = 1

我正在尋找一種有效的方法來執行此操作。 謝謝！

Answer 1

您可以使用DataFrame的apply方法。

df['count'] = df.apply(lambda x: 1 if x.category in x.category_pred else 0, axis = 1)

這將根據需要添加新列

對於Pandas數據框中的每一行，確定另一列中是否存在一列值

問題描述

1 個解決方案

解決方案1
1 已采納 2015-09-16 20:47:46

對於Pandas數據框中的每一行，確定另一列中是否存在一列值

問題描述

1 個解決方案

解決方案1 1 已采納 2015-09-16 20:47:46

解決方案1
1 已采納 2015-09-16 20:47:46