[英]Multi Conditional if Statement Pandas (code doesn't finish running)
嘗試根據其他列值在 pandas 中創建多條件新列。
以下代碼不會產生錯誤或結果(但會產生警告); 它一直在運行:
for val1,val2 in zip(df['a'], df['b']):
if val1 == 0 and val2 == 0:
df['new_column'] = 0
elif val1 in df['a'] == 0:
df['new_column'] = 1
else:
for val2 in df['b']:
if val2 ==0:
df['new_column'] = 0
else:
df['new_column'] = df['b'] / df['a']
df 看起來像:
['a'] ['b']
0 0
0 1000
1000 0
5000 2000
期望 df['new column'] 是這樣的:
['new column']
0
1
0
.4
這可能不是最優雅的解決方案,但根據問題中提供的有限信息,此代碼至少會生成您預期的輸出:
def myfunc(row):
if row['a'] == 0 and row['b'] == 0:
result = 0
else:
if row['a'] == 0:
result = 1
elif row['b'] == 0:
result = 0
else:
result = row['b'] / row['a']
return result
df['new column'] = df.apply(myfunc, axis=1)
不要使用循環/ apply
,使用矢量代碼:
df['new'] = (df['b'].div(df['a'].mask(df['a'].eq(0),df['b']))
.fillna(0)
)
輸出:
a b new
0 0 0 0.0
1 0 1000 1.0
2 1000 0 0.0
3 5000 2000 0.4
與@cucurbit 在細節上有所不同,但原理相同:
def vals(x, y):
if x == 0 and y == 0:
return 0
if x == 0 :
return 1
if y == 0:
return 0
else:
return y/x
df['new column'] = df.apply(lambda x : vals(x['a'], x['b']), axis =1)
事實證明,我所從事的工作特別需要的是利用嵌套的 np.where 語句。 定義一個函數並應用它並沒有為我產生正確的計算結果。
df['new_column'] = np.where((df['a'] == 0) & (df['b'] == 0), 0,
np.where(df['a'] == 0, 1,
np.where(df['b'] ==-0, 0, df['b']/df['a']
)))
我感謝大家的意見。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.