繁体   English   中英

从python中的字符串中删除奇怪的字符

[英]remove strange characters from a string in python

我必须解析一些从Web获取的Web数据。 Web内容很有可能是我在处理任何问题时都可以使用的不同区域语言。 但是有些无效字符出现在某些字符串中,例如

我正在唤醒8qî4½-ôMºÝCQ´Dɬ)Q + R±}Ûýï7üÛ²ëlY&53 |8ïôóg/ ^ÿûêþ?ï¯a#ï?¼ºy{5+B^ß¿ß~¾¿½¦ÓûÆk.c¹~WÚ@뤤 KÈh4rF-G¦!¹ÿ¬¦a〜µuÓñµ_»|þì每日统计数据

我必须删除这种奇怪的字符并从Onyl提取有效字符串。 我正在使用python。 我用utf-8编码每个字符串。

如果您用陌生的方式表示不算ascii,则可以尝试:

import string
"".join(filter(lambda char: char in string.printable, s))

s是您的字符串。 以下是一些您可以过滤的字符串常量: https : //docs.python.org/3/library/string.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM