繁体   English   中英

使用 pandas 迭代 dataframe 并替换字符

[英]Iterating through dataframe with pandas and replacing characters

我的名为“收缩”的数据框列如下所示:

-Shrinkage
-($614)
-$0
-$0
-$0
-$0
-$0
-$0
-$0
-($125)
-$320
-$3,779
($2,482)

使用以下代码,我尝试使用 for 循环和 if 语句执行多个操作。 我想遍历该列,如果 object 具有字符“(”,那么我想将其替换为字符“-”以使该数字为负数。除了查找和替换负数外,我还想删除所有字符并将对象变为浮点数以使用它执行数学运算。

for i in ['Shrinkage']:
    if df['Shrinkage'] == '(':
        df['Shrinkage'] = df['Shrinkage'].replace({'(': '-'}).astype(float)
        df['Shrinkage'] = df['Shrinkage'].replace({'$': '', ')': '', ',': ''})
    else:
        df['Shrinkage'].replace({'$': '', ',': ''}, regex=True).astype(float)

我得到一个 ValueError: 系列的真值是不明确的。 使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。

请理解我对 python 还是新手,还没有进入复杂的代码。 需要一些帮助。

试试这个, series.replace并使用正则表达式删除不需要的字符。

df['Shrinkage'] = df['Shrinkage'].str.replace("\(|\$|\)|,", "")

print(df['Shrinkage'].astype(float))

output,

0     -614.0
1       -0.0
2       -0.0
3       -0.0
4       -0.0
5       -0.0
6       -0.0
7       -0.0
8     -125.0
9     -320.0
10   -3779.0
11    2482.0
Name: Shrinkage, dtype: float64

你可以这样做:

df['Shrinkage'] = df['Shrinkage'].str.replace('\$|\)|\,', '')
df['Shrinkage'] = df['Shrinkage'].str.replace('\(', '-')
df['Shrinkage'] = df['Shrinkage'].astype(float)
print(df)


    Shrinkage
0      -614.0
1         0.0
2         0.0
3         0.0
4         0.0
5         0.0
6         0.0
7         0.0
8      -125.0
9       320.0
10     3779.0
11    -2482.0

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM