![](/img/trans.png)
[英]Create new column in dataframe based on conditions in existing columns
[英]Create new column in dataframe based on certain conditions met in previous columns
我想根据某个值是否接连出现在 dataframe 中创建一个新列。 示例我的 df 看起来像:
编辑:(值可以包含(A,N,E,V))
Name Jan Feb Mar April
John N N E E
Alex E E E E
Alice E E E N
如果有人从前几个月的“N”值更改为“E”,则我希望有一个新的“指定”列返回 1,如果有其他情况,则返回“0”。 本质上,这个 dataframe 来自每月更新的 excel 文件,因此最新月份将出现在最后一列中。
我有一个代码
def func(u,x,y,z):
if u =='N' and x== 'E':
return 1
elif x =='N' and y == 'E':
return 1
elif y =='N' and z == 'E':
return 1
else:
return 0
本质上,我想要一个不需要每个月都更新的代码,并且可以只使用列索引来返回值。
与右移相同的 dataframe 进行比较。 由于 'N' > 'E',转换为 int 将生成你想要的
>>> df = pd.DataFrame({'Jan': list('NEE'), 'Feb': list('NEE'), 'Mar': 'E', 'April': list('EEN')})
>>> df
Jan Feb Mar April
0 N N E E
1 E E E E
2 E E E N
>>> (df < df.shift(1, axis=1)).astype(int)
Jan Feb Mar April
0 0 0 1 0
1 0 0 0 0
2 0 0 0 0
如果您只想对最后一列执行相同操作,只需
(df.iloc[:, -1] < df.iloc[:, -2]).astype(int)
UPD:如果有其他字母,应该是:
(( df.shift(1, axis=1) == 'N') & (df == 'E')).astype(int)
或者,对于单个列:
((df.iloc[:, -2] == 'N') & (df.iloc[:, -1] == 'E')).astype(int)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.