繁体   English   中英

如何用 Pandas 数据框中的 NaN 替换一系列值?

[英]How to replace a range of values with NaN in Pandas data-frame?

我有一个巨大的数据框。 我应该如何用 NaN 替换一系列值 (-200, -100)?

数据框

您可以使用pd.DataFrame.mask

df.mask((df >= -200) & (df <= -100), inplace=True)

此方法将布尔数组中由True值标识的元素替换为指定值,如果未指定值,则默认为NaN

等效地,将pd.DataFrame.where与相反的条件一起使用:

df.where((df < -200) | (df > -100), inplace=True)

系列

与许多方法一样,Pandas 有助于包含适用于系列而不是整个数据框的版本。 因此,对于列df['A'] ,您可以将pd.Series.maskpd.Series.between pd.Series.mask使用:

df['A'].mask(df['A'].between(-200, -100), inplace=True)

对于链接,请注意默认情况下inplace=False ,因此您也可以使用:

df['A'] = df['A'].mask(df['A'].between(-200, -100))

你可以这样做:

In [145]: df = pd.DataFrame(np.random.randint(-250, 50, (10, 3)), columns=list('abc'))

In [146]: df
Out[146]:
     a    b    c
0 -188  -63 -228
1  -59  -70  -66
2 -110   39 -146
3  -67 -228 -232
4  -22 -180 -140
5 -191 -136 -188
6  -59  -30 -128
7 -201 -244 -195
8 -248  -30  -25
9   11    1   20

In [148]: df[(df>=-200) & (df<=-100)] = np.nan

In [149]: df
Out[149]:
       a      b      c
0    NaN  -63.0 -228.0
1  -59.0  -70.0  -66.0
2    NaN   39.0    NaN
3  -67.0 -228.0 -232.0
4  -22.0    NaN    NaN
5    NaN    NaN    NaN
6  -59.0  -30.0    NaN
7 -201.0 -244.0    NaN
8 -248.0  -30.0  -25.0
9   11.0    1.0   20.0

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM