[英]Regex for certain characters in python
我正在尝试从文本中提取某些字符,但在这些文本中遇到了一些特殊字符,我不确定它们是表情符号还是其他东西。 我需要从句子中提取那些特殊字符并需要某种正则表达式。这是带有特殊字符的句子-
'technews 一个孤独的家伙在 Apple\\x89Ûª SXSW 商店等待 iPad 2'
尝试这个。 如果字符或数字,你可以做相反的方式只额外的:
选项1:
import re
ini_string = "'technews One lone dude awaits iPad 2 at Apple\x89Ûªs SXSW store"
res1 = " ".join(re.split("[^A-Za-z0-9]+", ini_string))
print(res1)
选项2:
result2 = ini_string.encode().decode("utf-8").replace(u"\x89Ûª", "`").encode("utf-8")
选项 3:
new_string = ini_string.encode('ascii',errors='ignore')
print(new_string)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.