簡體   English   中英

使用熊貓中的另一列替換一列中的值的有效方法

[英]Efficient way to replace values in one column using another column in pandas

如何使用不同列 [2] 中的字符串值列表替換數據框列 [1] 中的字符串值。

數據

          0                       1            2              3
0  3000 20%  dummy1 3000 dummy2 20%  [3000, 20%]  dummy1 dummy2

我想使用第 2 列中的列表(即“[3000, 20%]”)替換第 1 列中的字符串值,即“dummy1 3000 dummy2 20%”。 所以 3000 和 20% 被替換為字符串中的“”(空字符串)以形成第三列(結果)即“dummy1 dummy2”

代碼

df = pd.DataFrame([['3000 20%', 'dummy1 3000 dummy2 20%']])
df[2] = df[0].str.split(' ')

def replace_string(x):
    repl_string = str(x[1])
    for key in x[2]:
        repl_string = repl_string.replace(key, '')
    return ' '.join(repl_string.split())

df[3] = df.apply(replace_string, axis=1)

我目前已經編寫了上面的代碼,這對於大型數據幀來說很慢。 如何提高此代碼的效率或有其他方法可以做到這一點?

使用嵌套列表理解:

df = pd.DataFrame([['3000 20%', 'dummy1 a 3000 dummy2 20%'],
                   ['abc 2%', 'klmn 3000 dummy2 2%']])
print (df)
          0                         1
0  3000 20%  dummy1 a 3000 dummy2 20%
1    abc 2%       klmn 3000 dummy2 2%

df[3] = [' '.join(y for y in j.split() if y not in i.split()) for i, j in zip(df[0], df[1])]
print (df)
          0                         1                 3
0  3000 20%  dummy1 a 3000 dummy2 20%   dummy1 a dummy2
1    abc 2%       klmn 3000 dummy2 2%  klmn 3000 dummy2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM