繁体   English   中英

将 pandas DataFrame 中带逗号的数字字符串转换为浮点数

[英]Convert number strings with commas in pandas DataFrame to float

我有一个 DataFrame,其中包含作为字符串的数字,并用逗号表示千位标记。 我需要将它们转换为浮点数。

a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)

我猜我需要使用 locale.atof。 的确

df[0].apply(locale.atof)

按预期工作。 我得到了一系列花车。

但是当我将其应用于 DataFrame 时,出现错误。

df.apply(locale.atof)

TypeError: (“无法将系列转换为”,u'occurred at index 0')

df[0:1].apply(locale.atof)

给出另一个错误:

ValueError: ('float() 的无效文字:1,200',u'出现在索引 0')

那么,如何将这个DataFrame的字符串转换为 DataFrame 的浮点数呢?

如果您正在从 csv 读取,那么您可以使用数千个 arg

df.read_csv('foo.tsv', sep='\t', thousands=',')

这种方法可能比将操作作为单独的步骤执行更有效。


您需要先设置语言环境

In [ 9]: import locale

In [10]: from locale import atof

In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'

In [12]: df.applymap(atof)
Out[12]:
      0        1
0  1200  4200.00
1  7000    -0.03
2     5     0.00

您可以一次转换一列,如下所示:

df['colname'] = df['colname'].str.replace(',', '').astype(float)

您可以使用pandas.Series.str.replace方法:

df.iloc[:,:].str.replace(',', '').astype(float)

此方法可以删除或替换字符串中的逗号。

这将适用于诸如“-55,00”或“5.500,00”之类的字符串,并将它们分别转换为浮点数 -55.00 和 5500.00。

df['colname'] = df['colname'].str.replace('.','', regex=True).str.replace(',', '.', regex=True).astype(float)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM