繁体   English   中英

Python-从.txt文件中清理数据?

[英]Python- Cleaning the data from .txt file?

 import pandas as pd import os import numpy as np import re #LOAD THE DATA df = pd.read_fwf('receipt.txt') data= df.replace("£", "") print(data)

我已尝试清理此数据并删除“£,:,-”,请问如何最好地从我的数据中删除这些符号? 请看附图。

 import pandas as pd import os import numpy as np #LOAD THE DATA df = pd.read_fwf('receipt.txt') df.head()

txt文件截图

您可以使用字符串替换并将不需要的字符串替换为空字符串“”,实质上是删除它们。

例子:

str.replace("unwanted", "")

如果您不必在每次运行代码时都执行此操作,请考虑使用简单的 shell“tr -d 'idontwantthis'”(假设 Linux/OSX)在脚本之外进行数据清理

你可以这样做:

readfilestr.replace("[the text to remove goes here]", "")

您可以查看正则表达式 (RegEx) 模块 re。

import re

string = "test with £,:,-"

new_string= re.sub('[£:-]', "", string)

print(new_string) # test with ,,

这里有一些很好的例子,

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM