繁体   English   中英

在Python 3中不会删除特殊的Unicode字符

[英]Special Unicode Characters are not removed in Python 3

我有一个包含单词的keys列表。 当我执行此命令时:

for key in keys:
  print(key)

我在终端中得到正常的输出。

在此处输入图片说明

但是当我使用print(keys)打印整个列表时,得到以下输出:

在此处输入图片说明

我已经尝试使用key.replace("\‬", '')key.replace("\\\‬", '')re.sub(u'\‬', '', key)但没有解决问题。 我也在这里尝试了解决方案,但是它们都不起作用:

在Python 3中替换字符串中的unicode字符

在python2.7中删除字符串中的unicode \\ u2026喜欢的字符

Python删除额外的特殊Unicode字符

如何使用Python删除非ASCII字符但保留句点和空格?

我使用Beautiful Soup从Google趋势中抓取了该信息,并从get_text()检索了文本。此外,在Google趋势页面的页面源中,单词列出如下:

在此处输入图片说明 当我直接从页面源代码中粘贴文本时,粘贴的文本没有这些异常的符号。‬‬

您可以使用strip字符。

>>> keys=['\u202cABCD', '\u202cXYZ\u202c']
>>> for key in keys:
...     print(key)
... 
ABCD
XYZ‬
>>> newkeys=[key.strip('\u202c') for key in keys]
>>> print(keys)
['\u202cABCD', '\u202cXYZ\u202c']
>>> print(newkeys)
['ABCD', 'XYZ']
>>> 

尝试了您的方法之一,它确实对我有用:

>>> keys
['\u202cABCD', '\u202cXYZ\u202c']
>>> newkeys=[]
>>> for key in keys:
...     newkeys += [key.replace('\u202c', '')]
... 
>>> newkeys
['ABCD', 'XYZ']
>>> 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM