![](/img/trans.png)
[英]Reading .doc file in Python using antiword in Windows (also .docx)
[英]Python: Open .doc file with antiword on windows
我正在尝试使用python打开文件夹中的一堆.doc文件(不是docx)。
我下载了经过修改的“ antiword”,它是Windows的预编译执行文件,因为原始的antiword仅适用于linux。
http://www-stud.rbi.informatik.uni-frankfurt.de/~markus/antiword/
下载后,我将其插入到python27文件夹中,然后运行antiword.exe文件。
老实说,我的问题是我不知道运行执行程序时发生了什么。 我曾希望它将库添加到我的python目录中,并且可以导入“ antiword”。 谁能帮我?
非常感谢。
乔纳斯(BR Jonas)
据我了解,antiword不是可以导入的python模块。 它是一个可执行文件,可以直接在命令提示符(cmd)中运行。 我按照00README.WIN文档中的说明安装了反字词,并且在将其文件夹添加到PATH环境变量以及完全按照README中所述创建HOME环境变量之后,可以在cmd中运行它。 我可以使用在antiword \\ Doc \\中找到的testdoc.doc成功运行以下示例
antiword -m cp852.txt filename.doc > filename.txt
我认为,如果你需要做这在Python中,你可以运行antiword类似于任何cmd命令如前面解释的 。 以前曾建议过同样的事情。 您也可以按照先前的建议尝试IronPython。
我希望这有帮助!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.