簡體   English   中英

Python-從.txt文件中清理數據?

[英]Python- Cleaning the data from .txt file?

 import pandas as pd import os import numpy as np import re #LOAD THE DATA df = pd.read_fwf('receipt.txt') data= df.replace("£", "") print(data)

我已嘗試清理此數據並刪除“£,:,-”,請問如何最好地從我的數據中刪除這些符號? 請看附圖。

 import pandas as pd import os import numpy as np #LOAD THE DATA df = pd.read_fwf('receipt.txt') df.head()

txt文件截圖

您可以使用字符串替換並將不需要的字符串替換為空字符串“”,實質上是刪除它們。

例子:

str.replace("unwanted", "")

如果您不必在每次運行代碼時都執行此操作,請考慮使用簡單的 shell“tr -d 'idontwantthis'”(假設 Linux/OSX)在腳本之外進行數據清理

你可以這樣做:

readfilestr.replace("[the text to remove goes here]", "")

您可以查看正則表達式 (RegEx) 模塊 re。

import re

string = "test with £,:,-"

new_string= re.sub('[£:-]', "", string)

print(new_string) # test with ,,

這里有一些很好的例子,

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM