如何從字符串列表中刪除特殊字符？

Question

我正在讀取文件並在文件內容上使用正則表達式來執行一些操作。 在讀取文件時，我沒有在其中找到任何特殊字符，但是在文件內容上使用正則表達式並將其保存到列表后，數字前有特殊字符，如 \\t 和 \\xa0。

示例文件內容：

Hydrochloric Acid to pHÂ 3.3-5.0        q.s.    q.s.    q.s.    pH-regulator    Ph Eur, NF

應用正則表達式后變為：

Hydrochloric Acid to pHÂ\xa03.3-5.0\tq.s.\tq.s.\tq.s.\tpH-regulator\tPh Eur, NF

如何在沒有單獨的字符串替換技術的情況下刪除所有這些？

代碼：

def extract(filename):
    file=open(filename)
    file=file.read()
    print(file)
    print("wefewwEF3RF3")
    result = []
    med = r"(?:{})".format("|".join(map(re.escape, medicines)))
    pattern = re.compile(r"^\s*" + med + r".*(?:\n[^\w\n]*\d*\.?\d+[^\w\n]*(?:\n.*){2})?", re.M|re.IGNORECASE)
    result = pattern.findall(file)
#    result.encode('ascii', 'ignore')
    newresult = []
    for line in result:
        newresult.append((line.strip()))
    return newresult

新newresult列表包含原始文件中不存在的所有這些特殊字符。

Answer 1

如果您知道所有這些特殊字符，您可以使用 str 的maketrans和translate方法將它們替換為以下方式的空格：

txt = 'Hydrochloric Acid to pHÂ\xa03.3-5.0\tq.s.\tq.s.\tq.s.\tpH-regulator\tPh Eur, NF'
t = ''.maketrans('\xa0\t','  ')
newtxt = txt.translate(t)
print(newtxt)

輸出

Hydrochloric Acid to pHÂ 3.3-5.0 q.s. q.s. q.s. pH-regulator Ph Eur, NF

maketrans接受 2 或 3 個參數。 它創建轉換表，然后可以在translate方法中使用它並按如下方式工作：來自maketrans第一個參數的每個字符maketrans被替換為來自maketrans第二個參數的相應字符（因此它們必須具有相等的長度）並且每個字符出現在第三個參數中的 maketrans 被刪除。 在上面的例子中， \\xa0被替換為空格， \\t被替換為空格。

Answer 2

你好，

你能在不同的 Python 版本下檢查你的代碼嗎？ 它似乎在 3.8.0 上沒有錯誤。

def extract(filename):
    file='Hydrochloric Acid to pHÂ 3.3-5.0        q.s.    q.s.    q.s.    pH-regulator    Ph Eur, NF'
    result = []
    med = r"(?:{})".format("|".join(map(re.escape, file)))
    pattern = re.compile(r"^\s*" + med + r".*(?:\n[^\w\n]*\d*\.?\d+[^\w\n]*(?:\n.*){2})?", re.M|re.IGNORECASE)
    result = pattern.findall(file)
    #result.encode('ascii', 'ignore')
    newresult = []
    for line in result:
        newresult.append((line.strip()))
    print(file)
    print (newresult)
    return newresult
extract('test')

如何從字符串列表中刪除特殊字符？

問題描述

2 個解決方案

解決方案1
1 2020-02-03 08:49:12

解決方案2
0 2020-02-03 08:18:45

如何從字符串列表中刪除特殊字符？

問題描述

2 個解決方案

解決方案1 1 2020-02-03 08:49:12

解決方案2 0 2020-02-03 08:18:45

解決方案1
1 2020-02-03 08:49:12

解決方案2
0 2020-02-03 08:18:45