繁体   English   中英

python中某些字符的正则表达式

[英]Regex for certain characters in python

我正在尝试从文本中提取某些字符,但在这些文本中遇到了一些特殊字符,我不确定它们是表情符号还是其他东西。 我需要从句子中提取那些特殊字符并需要某种正则表达式。这是带有特殊字符的句子-

'technews 一个孤独的家伙在 Apple\\x89Ûª SXSW 商店等待 iPad 2'

尝试这个。 如果字符或数字,你可以做相反的方式只额外的:

选项1:

import re
ini_string = "'technews One lone dude awaits iPad 2 at Apple\x89Ûªs SXSW store"
res1 = " ".join(re.split("[^A-Za-z0-9]+", ini_string)) 
print(res1)

选项2:

result2 = ini_string.encode().decode("utf-8").replace(u"\x89Ûª", "`").encode("utf-8")

选项 3:

new_string = ini_string.encode('ascii',errors='ignore')
print(new_string)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM