繁体   English   中英

根据多个条件从 pandas dataframe 中删除具有 NaN 的行

[英]Drop rows with NaNs from pandas dataframe based on multiple conditions

我有一个带有很多 NaN 的 dataframe。

y列表示事件的计数, val表示该 yeat 中每个事件的值, total表示两列的乘积。

由于values不可用(多达 80% 的数据丢失),许多列都有零,许多列有 NaN。是 4 列。

y17 y18 y19 y20 val17 va18 val19 val20 total17 total18 total19 total20
 1   2   1   2    2    2     2    2       1      4        2      4
 2   2   2   2    2    2     2    2       4      4        4      4
 3   3   3   3   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN
 0   0   0   0    1    2     3    4       0      0        0      0
 0   0   0   0   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN

我想保留所有值为零和数字行,并且我想保留前四列(多个条件)为零的行。

预期 output

y17 y18 y19 y20 val17 va18 val19 val20 total17 total18 total19 total20
 1   2   1   2    2    2     2    2       1      4        2      4
 2   2   2   2    2    2     2    2       4      4        4      4
 0   0   0   0    1    2     3    4       0      0        0      0
 0   0   0   0   NaN  NaN   NaN  NaN     NaN    NaN      NaN    NaN

谢谢!

只需通过all条件

out = df[df.iloc[:,:4].eq(0).all(1) | df.notna().all(1)]
Out[386]: 
   y17  y18  y19  y20  val17  ...  val20  total17  total18  total19  total20
0    1    2    1    2    2.0  ...    2.0      1.0      4.0      2.0      4.0
1    2    2    2    2    2.0  ...    2.0      4.0      4.0      4.0      4.0
3    0    0    0    0    1.0  ...    4.0      0.0      0.0      0.0      0.0
4    0    0    0    0    NaN  ...    NaN      NaN      NaN      NaN      NaN
[4 rows x 12 columns]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM