[英]How to convert this regular expression into Python
我想在Python中使用此正則表達式:
<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>
def removeHtmlTags(page):
p = re.compile(r'XXXX')
return p.sub('', page)
看來我不能直接將復雜的正則表達式替換為上述函數。
在這里工作正常。 您可能因為引號而遇到麻煩。 只需三引號即可:
def removeHtmlTags(page):
p = re.compile(r'''<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>''')
return p.sub('', page)
如果您需要刪除HTML標簽,則應這樣做:
import re
def removeHtmlTags(page):
pattern = re.compile(r'\<[^>]+\>', re.I)
return pattern.sub('', page)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.