[英]Assign values in new column on condition pandas
我有一个数据框:
id name value
1 asd 0.5
2 fgg 0.8
3 hfd 1.5
4 erw 0.5
我必须创建一个新的列accept
,如果值大于1.0,则将outlier
设为1,否则设为0。
id name value accept
1 asd 0.5 0
2 fgg 0.8 0
3 hfd 1.5 1
4 erw 0.5 0
我可以使用iterrows并使用.loc。
for index,row in df.iterrows():
if row['value']>1:
df.loc[df.index==row.index,'accept'] = 1
else:
df.loc[df.index==row.index,'accept'] = 0
有没有更简单的方法可以做到这一点而无需迭代?
将条件强制转换为int
- True
转换为1
, False
转换为0
:
df['accept'] = (df['value'] > 1).astype(int)
print (df)
id name value accept
0 1 asd 0.5 0
1 2 fgg 0.8 0
2 3 hfd 1.5 1
3 4 erw 0.5 0
对于另一个值,请使用numpy.where
:
df['accept'] = np.where(df['value'] > 1, 'high', 'low')
print (df)
id name value accept
0 1 asd 0.5 low
1 2 fgg 0.8 low
2 3 hfd 1.5 high
3 4 erw 0.5 low
只要您的值介于0到2之间,请使用np.floor
+ astype(int)
。
df['accept'] = np.floor(df.value).astype(int)
df
id name value accept
0 1 asd 0.5 0
1 2 fgg 0.8 0
2 3 hfd 1.5 1
3 4 erw 0.5 0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.