简体   繁体   English

如何将旧的MS Word文档转换为纯文本?

[英]How to convert old MS Word documents to plain text?

I want to get textual content from MSword 03 or older versions. 我想从MSword 03或更早版本获取文本内容。 Is there a script or software package that can do this? 是否有可以执行此操作的脚本或软件包?

I am able to get text out of word files for 2007 documents. 我能够从2007年文档的word文件中获取文本。 I am not able to get the same from older versions (.doc). 我无法从旧版本(.doc)获得相同的内容。

I am using apache2 and php mysql. 我正在使用apache2和php mysql。

Try catdoc , which converts any .doc file into plain text. 尝试catdoc ,它将任何.doc文件转换为纯文本。 See the catdoc homepage . 请参阅catdoc主页

这是http://obninsk.name/obninsk_doc/上的 ms word文档的PHP类。

您可以使用LiveDocx处理所有MS Word文件,包括RTF http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM