繁体   English   中英

根据多个DataFrame的条件新建DataFrame

[英]Create A New DataFrame Based on Conditions of Multiple DataFrames

我有两个数据集:一个是癌症阳性患者(df_pos),另一个是癌症阴性患者(df_neg)。

df_pos

    id
0   123
1   124
2   125

df_neg

    id
0   234
1   235
2   236

如果患者是否患有癌症(是或否),我想将这些数据集编译成一个带有额外列的数据集。

这是我想要的结果:

    id  outcome
0   123 yes
1   124 yes
2   125 yes
3   234 no
4   235 no
5   236 no

编译这些更聪明的方法是什么?

任何建议,将不胜感激。 谢谢!

Use pandas.DataFrame.append and pandas.DataFrame.assign :

>>> df_pos.assign(outcome='Yes').append(df_neg.assign(outcome='No'), ignore_index=True)
    id outcome
0  123     Yes
1  124     Yes
2  125     Yes
3  234      No
4  235      No
5  236      No
df_pos['outcome'] = True
df_neg['outcome'] = False

df = pd.concat([df_pos, df_neg]).reset_index(drop=True)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM