繁体   English   中英

弧名的python zipfile编码

[英]python zipfile encoding for arcname

我正在尝试使用Python的zipfile库将多个文件添加到zip中。 问题出在压缩的文件名中,其中包含特殊字符(utf-8)。

这是一个基本代码:

#!/usr/bin/env python

import zipfile

infilename = "test_file"
outfilename = "test.zip"
filename = u'Conf\xe9d\xe9ration.txt'

if __name__ == '__main__':
    f = open(outfilename, "w")
    archive = zipfile.ZipFile(f, "w", zipfile.ZIP_DEFLATED)
    archive.write(infilename, filename.encode("CP437"))
    archive.close()
    f.close()

并非每个zip提取器都正确读取生成的文件:

  • Ubuntu 10.04和11.10:Conf?d?ration.txt
    无法提取文件:“警告:文件名不匹配:Conf \\?d \\?ration.txt”

  • Windows XP和7:Confédération.txt
    可以读取文件

  • MacOSX(Lion):ConfÇdÇration.txt
    可以读取文件

我尝试不对CP437进行编码而仅将以下一行更改为:

    archive.write(infilename, filename)

这次Ubuntu仍然有同样的问题,Windows给出了“ Conf +®d+®ration.txt”,而MacOSX则完美运行。

有人知道(pythonic)跨平台解决方案吗?

谢谢!

看起来文件名是按“原样”编写的(即,第一次使用CP437编码编写,第二次-使用UTF8编写),而其他归档处理程序使用不同的方法:

  • Windows:它将DOS / OEM编码用于存档内的文件名,这就是CP437起作用的原因。 并且,此行为在PKWare标准中进行了描述;
  • Mac OS:它默默使用utf-8,这违反了标准。 这就是utf8在Mac OS上运行的原因。
  • Linux / Unix:他们使用系统代码页作为归档文件中的文件名,不知道您的Linux安装是配置到哪个目录,而不是DOS,也不是UTF8编码:)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM