簡體   English   中英

Python open.doc 文件

[英]Python open .doc file

我正在做一個項目,我需要從多個 doc 和 docx 文件中讀取文本。 docx 文件很容易用 docx2txt 模塊完成,但我不能因為我的愛使它適用於 doc 文件。 我嘗試過使用 textract,但它似乎不適用於 Windows。 我只需要文件中的文本,沒有圖片或類似的東西。 有任何想法嗎?

我發現這似乎有效:

import win32com.client
text = win32com.client.Dispatch("Word.Application")
text.visible = False
wb = text.Documents.Open("myfile.doc")
document = text.ActiveDocument
print(document.Range().Text)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM