![](/img/trans.png)
[英]UnicodeEncodeError: 'ascii' codec can't encode character […]
[英]pprint: UnicodeEncodeError: 'ascii' codec can't encode character
这让我发疯。 我试图用é char pprint
一个dict
,它把我扔出去了。
我正在使用 Python 3:
from pprint import pprint
knights = {'gallahad': 'the pure', 'robin': 'the bravé'}
pprint (knights)
错误:
File "/data/prod_envs/pythons/python36/lib/python3.6/pprint.py", line 176, in _format
stream.write(rep)
UnicodeEncodeError: 'ascii' codec can't encode character '\xe9' in position 43: ordinal not in range(128)
我阅读了 Python ASCII 文档,但似乎没有一种快速的方法可以解决这个问题,除了将 dict 拆开,然后通过.encode
将违规值重写为 ASCII 值,然后再次重新组装 dict
有什么办法可以在不拆开字典的情况下打印出来?
这是无关pprint
:模块仅格式化字符串转换成另一个字符串,然后经过格式化的字符串的基础流。 因此,当é
字符 (U+00E9) 写入 stdout 时,会发生您的错误。
现在它真的取决于底层操作系统和 Python 解释器的配置。 在 Linux 或其他类 Unix 系统中,您可以尝试通过在启动 Python 之前设置环境变量PYTHONIOENCODING
在终端会话中声明 UTF-8 或 Latin1 字符集:
$ export PYTHONIOENCODING=Latin1
$ python
(或根据终端或终端窗口的实际编码使用PYTHONIOENCODING=utf8
)。
标准输入和输出是 Python 中的文件对象。 Python 3 文档说,当创建这些对象时,如果未指定encoding
则locale.getpreferredencoding(False)
以获取区域设置的首选编码。
在安装 GNU/Linux 时,您的系统应该已经设置了一个或多个“语言环境”(我从您的路径中猜测您正在使用某个版本的 GNU/Linux)。 在“合理”设置中,默认语言环境应允许使用 UTF-8。 但是,如果您只进行了“最小”安装(例如作为设置容器的一部分)或类似的东西,那么系统可能已将语言环境设置为"C"
(最终的后备语言环境),这确实不支持UTF-8。
仅仅因为您的终端可以接受 UTF-8(如使用echo
和 UTF-8 字符串所示),并不意味着Python 知道UTF-8 是可以接受的。 如果 Python 看到语言环境设置为"C"
则除非另有说明,否则它将假定只允许使用 ASCII。
您可以通过在 shell 提示符下键入locale
来检查当前区域locale
,并通过设置LC_ALL
环境变量来更改它。 但是在更改它之前,您必须检查locale -a
以查看您的系统上可用的语言环境,否则您的更改可能无效并且无论如何您可能会获得"C"
语言环境。 如果您的系统没有设置您想要的语言环境,如果您有 root 访问权限,您可以添加它:大多数 GNU/Linux 发行版在您(重新)配置名为locales
的包时提供了执行此操作的选项,例如在 Debian 上/Ubuntu-based 发行版, sudo dpkg-reconfigure locales
应该会显示选项。
但有时你会在无需编写Python脚本尚未建立体面的语言环境的系统上运行的尴尬境地并没有什么可以做,因为你没有root和系统管理员坚持给你绝对的最小值。 那我们怎么办?
好吧,Python 本身就有选项。 您可以在运行 Python 之前运行export PYTHONIOENCODING=utf-8
,以告诉 Python 使用该编码,无论语言环境如何。 或者你可以给pprint
一个stream=
参数,设置为你自己使用open()
和encoding="utf-8"
参数open()
的流(尽管如果你想使用sys.stdout
或os.popen
而不是文件)。 或者您可以升级到 Python 3.7 并使用sys.stdout.reconfigure(encoding='utf-8')
(但这在原始问题中提到的 Python 3.6 中不起作用)。
或者,您可以import codecs
并执行w=codecs.getwriter("utf-8")(sys.stdout.buffer)
然后将stream=w
传递给您的pprint
:
from pprint import pprint
import sys, codecs
w=codecs.getwriter("utf-8")(sys.stdout.buffer)
d = {"testing": "这是个考验"}
pprint (d, stream=w)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.