簡體   English   中英

保留對pdf到epub的喜愛

[英]Retaining the fond of pdf to epub

我目前正在開發一個使用 python 將 pdf 轉換為 epub 的項目。 在將 pdf 轉換為 epub 時,像字體系列一樣的樣式,epub 中的字體大小需要與 pdf 中的字體大小完全相同。 有沒有辦法使用python實現這一點? 而且我不需要任何外部軟件來做到這一點。 我用了aspose。

#我使用的代碼

將 aspose.words 導入為 aw

doc = aw.Document("Input.pdf") doc.save("Output.epub")

它是一個簡單的文本pdf。

您將獲得各種答案/評論,這些答案/評論會要求您顯示有關您嘗試過的內容的代碼並發布示例文檔等。

讓我為你省去麻煩。 您的問題似乎很簡單,因為想要將 pdf 轉換為 epub 並保留樣式信息。

祝你好運。

這一切都取決於您的 PDF 文件。 它有嵌入字體還是依賴系統字體? 布局復雜? 頁眉和頁腳? 圖像呢? Dingbats 字符? 如果pdf中沒有文字,而只是文字字符的后記繪制怎么辦? 如果 PDF 僅由 pdf 容器中的多個頁面掃描組成怎么辦? 都是英文的嗎? 任何Unicode字符? 您是否希望在頁面級別獲得正確的樣式? 段落? 句子? 單詞? 還是人物等級?

基本上這是一個難題。 PDF 被設計為最終使用格式,而不是可互換的格式。 大多數東西都會轉換為 PDF,因為有人想控制最終產品的外觀。 您可以查看 PDF 的文本提取工具,但沒有使用開源或商業工具的簡單解決方案。

您可以使用 Aspose.Words for Python 輕松地將 PDF 轉換為 EPUB。 代碼非常簡單:

import aspose.words as aw

doc = aw.Document("C:\\Temp\\in.pdf")
doc.save("C:\\Temp\\out.epub")

然而,在將 PDF 加載到 Aspose.Words 文檔對象模型時,它會從固定頁面布局轉換為流文檔。 當文檔保存到 EPUB 時,它會保存為流文檔。 恐怕,這可能會導致轉換時布局和格式丟失。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM