[英]Search and replace dots and commas in pandas dataframe
这是我的数据帧:
d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df
col1 col2
0 sku 1.1 9.876.543,21
1 sku 1.2 654
2 sku 1.3 321,01
col2 中的数据是本地格式的数字,我想将其转换为:
col2
9876543.21
654
321.01
我试过df['col2'] = pd.to_numeric(df['col2'], downcast='float')
,它返回一个 ValueError:: Unable to parse string "9.876.543,21" at position 0.
我也试过df = df.apply(lambda x: x.str.replace(',', '.'))
,它返回 ValueError: could not convert string to float: '5.023.654.46'
谢谢你的帮助!
如果可能,最好使用read_csv
参数:
df = pd.read_csv(file, thousands='.', decimal=',')
如果不可能,那么replace
应该有帮助:
df['col2'] = (df['col2'].replace('\.','', regex=True)
.replace(',','.', regex=True)
.astype(float))
你可以试试
df = df.apply(lambda x: x.replace(',', '&'))
df = df.apply(lambda x: x.replace('.', ','))
df = df.apply(lambda x: x.replace('&', '.'))
最好使用现有的标准系统设施。 知道某些语言环境以不同的方式使用逗号和小数点,我无法相信 Pandas 不会使用语言环境的格式。
果然,快速搜索揭示了 这个要点,它解释了如何利用语言环境将字符串转换为数字。 本质上,您需要import locale
并在构建数据locale.setlocale
之后调用locale.setlocale
来建立使用逗号作为小数点和句点作为分隔符的语言环境,然后应用数据applymapp
的applymapp
方法。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.