cost 312 ms
在不丟失任何格式的情況下將 PDF 轉換為 HTML

[英]Convert PDF to HTML without losing any format

我正在開發一個 Python Flask webapp,我正在嘗試將一些用戶上傳的 pdf 轉換為格式良好的 HTML,例如在iframe顯示 pdf 時生成的 HTML。 到目前為止,我嘗試了幾件事: pdfminer.six庫,產生了凌亂的 HTML, 當使用 pdf.js 渲染 ...

pdf2htmlEX 轉換文本但不可見(程序在 linux 上找不到字體文件?)

[英]pdf2htmlEX converts text but not visible (program can't find font file on linux?)

我正在使用pdf2htmlEX將 pdf 轉換為 html,並且當它在 mac 上本地生成時輸出正確顯示,但在 amazon linux 上的生產中生成時則不能正確顯示。 多個頁面都有這個問題,但我將使用此pdf 的第 22 頁作為具體示例。 對於不正確的 html 輸出(在 linux 上生成) ...

pdf2htmlEX 常見錯誤“無法加載字體”

[英]Pdf2htmlEX common error “Cannot load font”

從命令提示符運行 pdf2htmlEX.exe Windows 二進制文件按預期工作。 在包裝器(在我的情況下為.Net)中運行 pdf2htmlEX Windows 二進制文件時,我收到如下錯誤。 ...

2019-10-04 21:26:22   1   11    pdf2htmlex  
Pdf2Html安裝

[英]Pdf2Html Installation

我正在嘗試在Ubuntu Server 18.04.1 LTS上安裝Pdf2HtmlEx軟件。 存儲庫未維護,但軟件對我非常有用。 我將其安裝在Xubuntu桌面發行版和Docker映像上,但無法在ubuntu服務器上安裝它。 似乎pdf2htmlEx庫依賴項的某些新版本與該軟件的 ...

在heroku上安裝pdf2htmlEX

[英]Install pdf2htmlEX on heroku

我使用了這個 Aptfile: 並且安裝成功完成。 我什至在 heroku bash 中檢查了 pdf2htmlEX 的版本。 但是當我嘗試轉換真正的 PDF 文檔時,我收到了這個錯誤: 我在其他網站上發現我需要運行“make install”來解決這個問題,但不確定是否可以使用 her ...

pdf2HtmlEX - html 上的文本與源 pdf 不同

[英]pdf2HtmlEX - Text on html is different than the source pdf

我正在使用pdf2htmlEX以便將 pdf 文件轉換為 html。 之后我也從文件中提取文本。 問題: 我遇到一個文件,轉換后的 html 中的文本不可讀: https : //dspace.mit.edu/openaccess-disseminate/1721.1/101159 我使用的命 ...

pdf2htmlEX的輸出顯示Times New Roman字體只有幾個字符?

[英]pdf2htmlEX's output shows Times New Roman font for only a few characters?

我從未見過這樣的事情。 我使用了一個名為pdf2htmlEX的工具,該工具將PDF轉換為HTML,但是我遇到了一個奇怪的問題。 看下面的截圖: 看到第一個字符( W )? 在Times New Roman中。 現在這是更奇怪的部分: Times New Roman中只有 ...

即使單詞之間有空的HTML標記,也要替換單詞,這會使單詞分解

[英]Replace word even if it has empty HTML tags between it, which breaks it up

我知道這是一個相當奇怪的問題。 我使用了一個名為pdf2htmlEX的工具,該工具將PDF轉換為HTML。 到目前為止,結果令人印象深刻。 在轉換為HTML的所有PDF中,我還沒有看到一個錯誤。 使用此HTML,我需要用C#動態替換一些字符串。 但是,盡管我在導出為PDF之前在文檔 ...

Pdf2htmlEx:由pdf轉換的html大小很大嗎?

[英]Pdf2htmlEx: The html size converted by pdf is very large?

現在,我通過pdf2htmlEx將pdf轉換為html, 源文件pdf 21MB,轉換后的html將近900MB,轉換命令: 有什么辦法可以改善輸出html的大小? ...

2017-09-13 06:03:01   1   328    pdf2htmlex  
在 Python 中將 pdf 轉換為 html

[英]Transforming pdf to html in Python

蟒蛇 2.6 我正在嘗試解析我的 pdf 文件,一種方法是將其轉換為 html 並提取標題及其段落。 所以,我嘗試了 pdf2htmlEX 並將我的 pdf 轉換為 html 而不會干擾我的 pdf 格式......到目前為止,我很高興但是當我嘗試使用以下命令訪問我的標題時: 但是當我打開我的 ...

pdf2htmlEX 文本選擇問題

[英]pdf2htmlEX text selection issue

我已使用 pdf2htmlEX 將 pdf 轉換為 html。 選擇多行時,當光標在兩行之間移動時,選擇會向上跳躍。 有人請幫助解決這個問題。 這個問題已經在這里提出了https://github.com/coolwanglu/pdf2htmlEX/issues/62但解決方案沒有解決問題 ...

2016-09-22 06:50:30   1   298    pdf2htmlex  
使用pdf2htmlEX轉換多個文件

[英]Converting multiple files using pdf2htmlEX

如何在多個文件或包含pdf文件的文件夾上使用pdf2htmlEX? 我能夠很好地轉換單個文件,但我顯然不想為100個文件運行100次命令。 我在文檔中找不到任何內容,像'* .pdf'這樣的東西不起作用。 謝謝! ...

在 Heroku 上運行 pdf2htmlEX

[英]Running pdf2htmlEX on Heroku

我正在嘗試在 Heroku 上運行pdf2htmlEX 。 起初我想在與 Heroku 具有相同堆棧的 VM 上編譯 pdf2htmlEX,然后將二進制文件包含在 git repo 中。 那不起作用(我一直遇到依賴關系的問題)。 由於沒有專門用於運行pdf2htmlEX heroku buildp ...

從pdf獲取文本位置

[英]Getting text location from pdf

我想知道pdf頁面中所有單詞的位置。 我一直試圖在網上找到一些東西,但找不到。 任何人都可以幫助我應該使用哪個庫(最好在 java 平台中)? ...

使用pdf2htmlEX將pdf拆分為多個html文件

[英]split pdf to multiple html file with pdf2htmlEX

我正在嘗試將PDF文件拆分為單獨的HTML文件。 我的意思是每個PDF頁面都需要一個HTML文件。 這是我的方法: 結果,我得到了一個空的LMS.html和其他文件: lms%031.html , lms%032.html 。 問題是那些HTML文件的格式不正確,沒有CSS樣式? ...

cmake抱怨盡管安裝了最新版本的clang,但仍缺乏對編譯器C ++ 0x的支持

[英]cmake complaints about lack of support of C++0x of the compiler despite the latest version of clang is installed

我正在嘗試使用cmake構建pdf2htmlEX 這是錯誤消息: 這是clang編譯器的版本號 經過快速測試后,我意識到clang不支持-std=c++0x 。 我刪除了clang並安裝了g ++。 以下是相關的版本信息: 我已經進行了非常簡單的測試,看來g + ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM