[英]How to convert this regular expression into Python
我想在Python中使用此正则表达式:
<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>
def removeHtmlTags(page):
p = re.compile(r'XXXX')
return p.sub('', page)
看来我不能直接将复杂的正则表达式替换为上述函数。
在这里工作正常。 您可能因为引号而遇到麻烦。 只需三引号即可:
def removeHtmlTags(page):
p = re.compile(r'''<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>''')
return p.sub('', page)
如果您需要删除HTML标签,则应这样做:
import re
def removeHtmlTags(page):
pattern = re.compile(r'\<[^>]+\>', re.I)
return pattern.sub('', page)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.