簡體   English   中英

如何將此正則表達式轉換為Python

[英]How to convert this regular expression into Python

我想在Python中使用此正則表達式:

 <(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>

(來自RegEx匹配開放標簽,XHTML自包含標簽除外

def removeHtmlTags(page):
    p = re.compile(r'XXXX')
    return p.sub('', page)

看來我不能直接將復雜的正則表達式替換為上述函數。

在這里工作正常。 您可能因為引號而遇到麻煩。 只需三引號即可:

def removeHtmlTags(page):
    p = re.compile(r'''<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>''')
    return p.sub('', page)

如果您需要刪除HTML標簽,則應這樣做:

import re

def removeHtmlTags(page):
    pattern = re.compile(r'\<[^>]+\>', re.I)
    return pattern.sub('', page)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM