在一個列表中查找項目，但不在熊貓數據框列中的另一個列表中查找項目

Question

我一直在這里陷入死胡同，這讓我很傷心。

數據框：

accountid    col2                 col3
1            ['abc','def','xyz']  ['abc','mda','xyz','sdi']
2            ['abc','asd','xyz','dib]  ['nio','ouy','abc']
3            ['abc','def','xyz']  ['abc','mda','xyz']

筆記

* col2 和 col3 中的每個字段都是列表

* col2 和 col3 中的字段在列表中的項目數可能不同

結果應該看起來像我正在嘗試創建一個 col4 來顯示 col3 中不在 col2 中的項目：

accountid    col2                      col3                        col4
1            ['abc','def','xyz']       ['abc','mda','xyz','sdi']   ['mda','sdi']
2            ['abc','asd','xyz','dib]  ['nio','ouy','abc']         ['nio','ouy']
3            ['abc','def','xyz']       ['abc','mda','xyz']         ['mda']

如果這沒有意義，請告訴我。 我很感激在這方面的任何幫助。

Answer 1

讓我們做

s=df.col3.apply(set)-df.col2.apply(set)
0    {sdi, mda}
1    {nio, ouy}
2         {mda}
dtype: object
df['New']=s.map(list)

檢查結果

s.map(list)
0    [sdi, mda]
1    [nio, ouy]
2         [mda]
dtype: object

你的列表不是列表，它是字符串

import ast
df.iloc[:,1:]=df.iloc[:,1:].applymap(ast.literal_eval)

Answer 2

嘗試這個。 沿列axis=1應用 lambda 函數axis=1

df['col4'] = df.apply(lambda x : list(set(x['col3']).difference(set(x['col2']))), axis=1)

在一個列表中查找項目，但不在熊貓數據框列中的另一個列表中查找項目

問題描述

2 個解決方案

解決方案1
3 2020-03-10 00:57:25

解決方案2
1 2020-03-10 00:51:54

在一個列表中查找項目，但不在熊貓數據框列中的另一個列表中查找項目

問題描述

2 個解決方案

解決方案1 3 2020-03-10 00:57:25

解決方案2 1 2020-03-10 00:51:54

解決方案1
3 2020-03-10 00:57:25

解決方案2
1 2020-03-10 00:51:54