繁体   English   中英

如何将此正则表达式转换为Python

[英]How to convert this regular expression into Python

我想在Python中使用此正则表达式:

 <(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>

(来自RegEx匹配开放标签,XHTML自包含标签除外

def removeHtmlTags(page):
    p = re.compile(r'XXXX')
    return p.sub('', page)

看来我不能直接将复杂的正则表达式替换为上述函数。

在这里工作正常。 您可能因为引号而遇到麻烦。 只需三引号即可:

def removeHtmlTags(page):
    p = re.compile(r'''<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>''')
    return p.sub('', page)

如果您需要删除HTML标签,则应这样做:

import re

def removeHtmlTags(page):
    pattern = re.compile(r'\<[^>]+\>', re.I)
    return pattern.sub('', page)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM