[英]Python- Cleaning the data from .txt file?
import pandas as pd import os import numpy as np import re #LOAD THE DATA df = pd.read_fwf('receipt.txt') data= df.replace("£", "") print(data)
我已尝试清理此数据并删除“£,:,-”,请问如何最好地从我的数据中删除这些符号? 请看附图。
import pandas as pd import os import numpy as np #LOAD THE DATA df = pd.read_fwf('receipt.txt') df.head()
您可以使用字符串替换并将不需要的字符串替换为空字符串“”,实质上是删除它们。
例子:
str.replace("unwanted", "")
如果您不必在每次运行代码时都执行此操作,请考虑使用简单的 shell“tr -d 'idontwantthis'”(假设 Linux/OSX)在脚本之外进行数据清理
你可以这样做:
readfilestr.replace("[the text to remove goes here]", "")
您可以查看正则表达式 (RegEx) 模块 re。
import re
string = "test with £,:,-"
new_string= re.sub('[£:-]', "", string)
print(new_string) # test with ,,
这里有一些很好的例子,
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.