簡體   English   中英

Python搜索並替換大文件的正則表達式

[英]Python Search and Replace regex for large file

在python中使用正則表達式列表搜索和替換1GB文件中的一些特殊字符

def myreplace(text, dic):
    for i, j in dic.iteritems():
    text = text.replace(i, j)
    return text 

rep={"&":"and","-":"",'?':''}

achive=map(lambda x: myreplace(x, rep), achive) 

目前,在1 GB的測試文件中,性能還不錯。 想知道是否有可能使其性能更好。 在NLTK中是否有更好的方法可以做到這一點?

對於需要刪除的兩個單個字符,而對“與”號僅替換一個字符,使用翻譯可能更快。 這樣,您只分析字符串兩次,而不是三次。

achive = achive.translate(None, '-?').replace('&', 'and')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM