繁体   English   中英

将Doc或Docx转换为Java中的HTML

[英]Convert Doc or Docx into HTML in Java

如何在Java中将doc或docx转换为HTML。 使用Apache POI,我能够将doc转换为html,但无法将docx转换为html? 请给我看看示例代码? 此代码适用于doc,但不适用于docx。

        HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);

        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);

        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();
        serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);
        out.close();

        String result = new String(out.toByteArray());

没有理由不这样做。

请查看以下内容:

简而言之,请确保您使用的是最新版本的POI,并且具有所有必需的库。

(如果您需要其他帮助,请说明什么不起作用。您遇到编译时错误吗?运行时错误?意外输出?)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM