[英]how to match `“` with regex in python?
推文中有一个符号: “
“ @BrownieSWP:高是s ***吗???”您喜欢12 TF
符号不是"
。我编写此正则表达式来匹配它:
re.sub('(“|”)', '"', tweet)
此正则表达式(“|”)
以崇高的文字显示。 但这在python中不起作用。
您复制/粘贴的字符是U + 201C “左双引号”。 在re.sub()
您还具有相应的右引号U + 201D 。 也许您尝试粘贴它的环境未正确设置为正确处理Unicode,并将其转换为其他编码。 (另请参见如何在Sublime Text 2中查看文件的当前编码? )
您始终可以使用Python的转义码来明确且与ASCII兼容地引用Unicode字符。 re.sub(u'[\“\”]', '', tweet)
这个对我有用,
>>> s = r"“@BrownieSWP: High is s***????” you like 12 tf"
>>> m = re.sub(r'[”“]', r'', s)
>>> m
'@BrownieSWP: High is s***???? you like 12 tf'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.