在熊猫数据框中搜索和替换点和逗号

Question

这是我的数据帧：

d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df

       col1           col2
0   sku 1.1   9.876.543,21
1   sku 1.2            654
2   sku 1.3         321,01

col2 中的数据是本地格式的数字，我想将其转换为：

我试过df['col2'] = pd.to_numeric(df['col2'], downcast='float') ，它返回一个 ValueError:: Unable to parse string "9.876.543,21" at position 0.

我也试过df = df.apply(lambda x: x.str.replace(',', '.')) ，它返回 ValueError: could not convert string to float: '5.023.654.46'

谢谢你的帮助！

Answer 1

如果可能，最好使用read_csv参数：

df = pd.read_csv(file, thousands='.', decimal=',')

如果不可能，那么replace应该有帮助：

df['col2'] = (df['col2'].replace('\.','', regex=True)
                        .replace(',','.', regex=True)
                        .astype(float))

Answer 2

你可以试试

df = df.apply(lambda x: x.replace(',', '&'))
df = df.apply(lambda x: x.replace('.', ','))
df = df.apply(lambda x: x.replace('&', '.'))

Answer 3

最好使用现有的标准系统设施。 知道某些语言环境以不同的方式使用逗号和小数点，我无法相信 Pandas 不会使用语言环境的格式。

果然，快速搜索揭示了这个要点，它解释了如何利用语言环境将字符串转换为数字。 本质上，您需要import locale并在构建数据locale.setlocale之后调用locale.setlocale来建立使用逗号作为小数点和句点作为分隔符的语言环境，然后应用数据applymapp的applymapp方法。

在熊猫数据框中搜索和替换点和逗号

问题描述

3 个解决方案

解决方案1
24 已采纳 2018-03-03 19:43:38

解决方案2
0 2018-03-03 19:48:03

解决方案3
0 2018-03-03 20:09:45

在熊猫数据框中搜索和替换点和逗号

问题描述

3 个解决方案

解决方案1 24 已采纳 2018-03-03 19:43:38

解决方案2 0 2018-03-03 19:48:03

解决方案3 0 2018-03-03 20:09:45

解决方案1
24 已采纳 2018-03-03 19:43:38

解决方案2
0 2018-03-03 19:48:03

解决方案3
0 2018-03-03 20:09:45