繁体   English   中英

如何使用php从pdf,docx,doc获取html代码

[英]how to get html code from pdf,docx,doc using php

我想使用php将任何pdf,docx,doc文件转换为html代码。 与pdf中的样式相同。 我没有得到适当的解决方案。

                            Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');

                            // change pdfinfo bin location
                            Config::set('pdfinfo.bin', 'C:/poppler-0.37/bin/pdfinfo.exe');
                            // initiate
                            $pdf = new Gufy\PdfToHtml\Pdf($item);

                            // convert to html and return it as [Dom Object](https://github.com/paquettg/php-html-parser)
                            $html = $pdf->html();

不为我工作。

我认为这篇文章可以在第一时间为您提供帮助。 有了这个,您将能够使用PHP将任何pdf转换为HTML代码。

在此之后,您可以使用所提供的帮助, 这个帖子转换.doc和使用PHP 的.docx为PDF。

我认为您现在可以为要转换为HTML的每个文档扩展名构建函数。

祝好运。

我有一个类似的问题,我找到了一个与word docs一起使用的github。 当时效果还不错,但是最近我还没有进行测试。 试试吧。

https://github.com/benbalter/Convert-Word-Documents-to-HTML

我遇到了一个提供用于转换文档的API的Web服务。 我还没有对它进行非常彻底的测试,但是在将Word转换为HTML时,它确实产生了不错的结果:

https://cloudconvert.org/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM