繁体   English   中英

Python open.doc 文件

[英]Python open .doc file

我正在做一个项目,我需要从多个 doc 和 docx 文件中读取文本。 docx 文件很容易用 docx2txt 模块完成,但我不能因为我的爱使它适用于 doc 文件。 我尝试过使用 textract,但它似乎不适用于 Windows。 我只需要文件中的文本,没有图片或类似的东西。 有任何想法吗?

我发现这似乎有效:

import win32com.client
text = win32com.client.Dispatch("Word.Application")
text.visible = False
wb = text.Documents.Open("myfile.doc")
document = text.ActiveDocument
print(document.Range().Text)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM