繁体   English   中英

Python 2.7:在Windows控制台中输出utf-8

[英]Python 2.7: output utf-8 in Windows console

让我们说吧

s = u"test\u0627\u0644\u0644\u0647 \u0623\u0643\u0628\u0631\u7206\u767A\u043E\u043B\u043E\u043B\u043E"

如果我尝试直接打印,

>>> print s
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'cp932' codec can't encode character u'\u0627' in position 4: illegal multibyte sequence

所以我在Python中将控制台更改为UTF-8(否则它将无法理解我的输入)。

import win32console
win32console.SetConsoleOutputCP(65001)
win32console.SetConsoleCP(65001)

然后输出编码为utf-8的字符串,因为Python不知道chcp 65001是UTF-8(一个已知的bug )。

>>> print s.encode('utf-8')
testالله أكبر爆発ололоTraceback (most recent call last):
  File "<stdin>", line 1, in <module>
IOError: [Errno 0] Error

正如您所看到的,它会成功打印,直到它到达换行符,然后它会抛出IOError。

以下解决方法有效:

def safe_print(str):
    try:
        print str.encode('utf-8')
    except:
        pass
    print

>>> safe_print(s)
testالله أكبر爆発ололо

但必须有更好的方法。 有什么建议?

SO中搜索 python utf8窗口带来了第一个结果,问题是在Windows XP上用UTF8打印python,控制台描述了在Windows中从Windows打印utf8的问题。

我没有在Windows上测试它,但是在这里你可以得到一个小的初始化脚本,用于win / linux正确设置输出编码,包括日志接口等。该模块还使输出着色(包括更新'logging'接口)? 但你可以轻松地减少不必要的功能:-)。

如何调用非彩色变体:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
from setupcon import setup_console
setup_console('utf-8', False)

和彩色变体:

import setupcon
setupcon.setup_console()
import logging
#...
if setupcon.ansi:
    logging.getLogger().addHandler(setupcon.ColoredHandler())

如果解决方案适合您,您可以在这里阅读文档: http//habrahabr.ru/blogs/python/117236/ ,俄语,或者我/有人可以根据需要为您翻译:-)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM