繁体   English   中英

Python到ASCII的特殊HTML字符

[英]Special HTML characters in Python to ASCII

我想将网页阅读过程中看到的特殊字符转换为ASCII格式。 我已经尝试了很多,但是我无法弄清楚。 我将在下面给出一些示例,这些示例存储在Python中的字符串中。我不知道网页的当前编码是什么,但我想将其转换为ASCII格式。

Apaydın Ünal > want this to Apaydin Unal
Íñigo Martínez > want this to Inigo Martinez
Üstünel > want this to Ustunel

谁能帮我?

编辑:谢谢,我忘了。 我正在使用Python 2.7

尝试一下https://pypi.python.org/pypi/Unidecode

>>> from unidecode import unidecode
>>> unidecode(u'ko\u017eu\u0161\u010dek')
'kozuscek'

要检测编码,请参阅问题确定Python中文本的编码

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM