[英]delete CSV rows with conditional in python
我有一个 csv 文件,其中包含以下内容:
storeNumber, sale1, sale2
1, 1, 1
2, 0, 0
3, 1, 0
4, 0, 1
...
25, 0, 0
26, 1, 0
27, 0, 1
28, 0,0
我需要删除 sale1 和 sale2 等于 0 的行。
我有以下代码设置:
import pandas as pd
df = pd.read_csv('sales.csv', index_col=0)
df_new = df[df.sale1 != 0] and df[df.sale2 != 0]
print(df_new)
如果我只删除具有 0 值的每一列中的一列,则该代码有效。
df_new = df[df.sale1 != 0]
或者
df_new = df[df.sale2 != 0]
但是,当将上面的代码与“and”放在一起时,我收到一条错误消息:
ValueError: The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
删除 sale1 和 sale2 的值为 0 的行的正确代码是什么?
要运算符,您需要使用&
而不是and
来组合两个逻辑条件。 这在这里详细解释。 所以,你需要的是:
df_new = df[(df.sale1 != 0) & (df[df.sale2 != 0)]
请注意,两个条件都必须放在括号中,因为&
的绑定比!=
强。
另一种写法是只保留两列中的任何一个不等于零的行。
df.loc[df[['KC_1','KC_2']].ne(0).any(axis=1)]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.