繁体   English   中英

在Python中修复乱码的文件名?

[英]Fixing a gibberish filename in Python?

一个朋友在处理一堆被重命名为乱码的文件时遇到了麻烦。 看起来像这样:

03-ñîáä-áøâì-ùîàì.mp3

什么时候应该看起来像这样:

03-סמבה-ברגל-שמאל.mp3

现在,文件数量巨大,因此他问我是否可以使用python脚本。 我开始干预,但是不会让步。 我的假设是,这是一台CP-1255(或windows-1255 ),显示为utf-8 ,所以我尝试了:

fname.decode('utf-8').encode('windows-1255')

但是我收到“无法编码字符”错误。 因此,我然后尝试切换它们,还尝试了latin-1windows-1252cp862甚至ISO-8859-8 没有。

我该怎么办? 编码一直让我感到困惑。 我该如何处理?

我正在使用python 2.7

您几乎没错,但是原始编码是windows-1252 ,而不是utf-8

>>> print u'03-ñîáä-áøâì-ùîàì.mp3'.encode('cp1252').decode('cp1255')
03-סמבה-ברגל-שמאל.mp3

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM