![](/img/trans.png)
[英]How to modify numercial values in a column of mixed data types in a pandas dataframe?
[英]Change specific values in a Pandas DataFrame (where there are mixed types)
我有一个pandas数据帧,我想通过一些增量(比如.001)增加任何大于零的值,但只能在列的子集中增加。
df=pd.DataFrame({'a': ['abc', 'abc', 'abc', 'abc'], 'b': [2,np.nan, 0, 6], 'c': [1, 0, 2, 0]})
a b c
0 abc 2.0 1
1 abc NaN 0
2 abc 0.0 2
3 abc 6.0 0
所以我尝试了这个:
df[df.loc[:,['b', 'c']]>0]+=1
TypeError: Cannot do inplace boolean setting on mixed-types with a non np.nan value
但是,因为第一列有一个对象dtype,我不能这样做,因为你可以看到错误。 期望的输出是:
a b c
0 abc 2.001 1.001
1 abc NaN 0
2 abc 0.0 2.001
3 abc 6.001 0
有没有办法在没有明确循环遍历每一列的情况下执行此类操作?
我相信我只是错过了一个简单的方法,但似乎无法找到一个例子。
你可以试试这个:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['abc', 'abc', 'abc', 'abc'],
'b': [2,np.nan, 0, 6],
'c': [1, 0, 2, 0]})
inc = 0.01
df.loc[:, df.dtypes.ne('object')] += inc
df.replace({inc:0}, inplace=True)
print(df)
或者由Tai和np.where提出(这应该更快):
cols = df.columns[df.dtypes.ne('object')]
df[cols] += np.where(df[cols] >0, 0.01, 0)
返回:
a b c
0 abc 2.01 1.01
1 abc NaN 0.00
2 abc 0.00 2.01
3 abc 6.01 0.00
您可以使用add
with select_dtypes
df.add((df.select_dtypes(exclude=object)>0).astype(int)*0.0001).combine_first(df)
Out[18]:
a b c
0 abc 2.0001 1.0001
1 abc NaN 0.0000
2 abc 0.0000 2.0001
3 abc 6.0001 0.0000
您也可以只添加列b
和c
。
df[["b", "c"]] += np.where(df[["b", "c"]] > 0, 0.01, 0)
我们使用np.where
来填充0以绕过数据中的np.nan
。
Anton vBR有一种优雅的方式来选择一个需要的列。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.