[英]Create multiple DataFrames from a single DataFrame based on conditions
[英]Create A New DataFrame Based on Conditions of Multiple DataFrames
我有两个数据集:一个是癌症阳性患者(df_pos),另一个是癌症阴性患者(df_neg)。
df_pos
id
0 123
1 124
2 125
df_neg
id
0 234
1 235
2 236
如果患者是否患有癌症(是或否),我想将这些数据集编译成一个带有额外列的数据集。
这是我想要的结果:
id outcome
0 123 yes
1 124 yes
2 125 yes
3 234 no
4 235 no
5 236 no
编译这些更聪明的方法是什么?
任何建议,将不胜感激。 谢谢!
Use pandas.DataFrame.append
and pandas.DataFrame.assign
:
>>> df_pos.assign(outcome='Yes').append(df_neg.assign(outcome='No'), ignore_index=True)
id outcome
0 123 Yes
1 124 Yes
2 125 Yes
3 234 No
4 235 No
5 236 No
df_pos['outcome'] = True
df_neg['outcome'] = False
df = pd.concat([df_pos, df_neg]).reset_index(drop=True)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.