[英]Python- Cleaning the data from .txt file?
import pandas as pd import os import numpy as np import re #LOAD THE DATA df = pd.read_fwf('receipt.txt') data= df.replace("£", "") print(data)
我已嘗試清理此數據並刪除“£,:,-”,請問如何最好地從我的數據中刪除這些符號? 請看附圖。
import pandas as pd import os import numpy as np #LOAD THE DATA df = pd.read_fwf('receipt.txt') df.head()
您可以使用字符串替換並將不需要的字符串替換為空字符串“”,實質上是刪除它們。
例子:
str.replace("unwanted", "")
如果您不必在每次運行代碼時都執行此操作,請考慮使用簡單的 shell“tr -d 'idontwantthis'”(假設 Linux/OSX)在腳本之外進行數據清理
你可以這樣做:
readfilestr.replace("[the text to remove goes here]", "")
您可以查看正則表達式 (RegEx) 模塊 re。
import re
string = "test with £,:,-"
new_string= re.sub('[£:-]', "", string)
print(new_string) # test with ,,
這里有一些很好的例子,
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.