[英]How to replace the values in a dataframe column based on another dataframe condition
[英]How to replace values in a dataframe with values in another dataframe based on certain condition?
我想用数据帧“df”中相同id的“body”的值替换数据帧“result”的列“q1_body”和“q2_body”的值,代码如下:
def replace_body(x):
id1 = result.loc[x].qid1
result.loc[x].q1_body = df[df["qid"]==id1]["body"]
id2 = result.loc[x].qid2
result.loc[x].q2_body = df[df["qid"]==id2]["body"]
result.index.map(lambda x: replace_body(x))
当我运行代码时,我在ipython控制台中收到了以下提醒,程序就停留在这里:
//anaconda/lib/python3.6/site-packages/pandas/core/generic.py:3110:
SettingWithCopyWarning:
尝试在DataFrame的切片副本上设置值请参阅文档中的警告: http : //pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self [name] = value
希望有人能告诉我这里有什么问题。
假设两个数据帧是:
结果:
qid1 q1_body qid2 q2_body
1a abc 2a bcd
1a abc 3a cde
2a bcd 3a cde
DF:
qid body
1a sfgaks
2a shdfjk
3a adjkwf
预期的输出如下:
结果:
qid1 q1_body qid2 q2_body
1a sfgaks 2a shdfjk
1a sfgaks 3a adjkwf
2a shdfjk 3a adjkwf
这里:
# Set index and get body as a series
s = df.set_index(qid)['body']
result['q1_body'] = s.loc[result['qid1']].values
result['q2_body'] = s.loc[result['qid2']].values
结果:
qid1 q1_body qid2 q2_body
0 1a sfgaks 2a shdfjk
1 1a sfgaks 3a adjkwf
2 2a shdfjk 3a adjkwf
时间(10k行,使用自动生成的Lorem):
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.