简体   繁体   English

读取/提取.Doc文档所有文本

[英]Read/Extract .Doc Document all text

I want to extract all the text from the document .doc file. 我想从文档.doc文件中提取所有文本。

I have only the Stream object AND byte[] of the .doc document. 我只有.doc文件的Stream对象和byte[]

Tried the NOIP but they having unstable ver for .doc. 尝试过NOIP,但它们的.doc版本不稳定。

So, i need so library or some code to read/extract the .doc document. 所以,我需要这样的库或一些代码来读取/提取.doc文档。

The soultion should not dependent of Ms.Office. 灵魂不应依赖Office女士。

You might want to take a look at these options: 您可能想看看这些选项:

Use PInvokes or the Open XML SDK as described here: 如下所述使用PInvokes或Open XML SDK:

How to extract text from MS office documents in C# 如何从C#中的MS Office文档中提取文本

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM