在Python中使用UTF-8的反词

Question

这是我的代码：

from subprocess import Popen, PIPE
cmd = ['antiword', 'tbhocbong151.doc']
p = Popen(cmd, stdout=PIPE)
stdout, stderr = p.communicate()
print(stdout.decode('utf-8', 'ignore'))

我在文件字词中有这样的内容： "Chào bạn"

但是当我生成输出时是： "Ch?ob?n"

我如何解决它像输入一样的输出？ 谢谢你的帮助

Answer 1

我认为，问题是，当该区域设置不正确antiword运行。 尝试这个：

import os
from subprocess import Popen, PIPE
myenv = dict(os.environ)
if 'LC_ALL' in myenv:
    del myenv['LC_ALL']
myenv['LANG'] = 'en_US.UTF-8'
cmd = ['antiword', 'tbhocbong151.doc']
p = Popen(cmd, stdout=PIPE, env=myenv)
stdout, stderr = p.communicate()
print(stdout.decode('utf-8', 'ignore'))

如果那不起作用，请在运行python程序之前尝试在您的shell中设置LANG env变量； 例如通过做：

export LANG=en_US.UTF-8

在Python中使用UTF-8的反词

问题描述

1 个解决方案

解决方案1
2 2017-12-05 13:55:50

在Python中使用UTF-8的反词

问题描述

1 个解决方案

解决方案1 2 2017-12-05 13:55:50

解决方案1
2 2017-12-05 13:55:50