簡體 English 中英

如何逐頁獲取具有整個文件內容的base64的PDF文件的內容？

[英]How to get content of a PDF file page by page having base64 of the whole file content?

原文 2015-01-11 02:42:08 8 2 java/ parsing/ pdf/ base64

我有一個像JVBERi0xLjIgDSXi48/T...這樣的 base64 格式的 PDF 文件的內容。

我怎樣才能解析它以獲得它每一頁的base64？

假設 PDF 文件有 5 頁。 如何獲取base64中每個頁面的內容？ 我已經谷歌它但找不到任何東西。 任何幫助表示贊賞。

2 個解決方案

通常，甚至不可能逐頁分離原生PDF 文件的內容（正如您將看到的，當文件采用 base64 編碼時，就不可能這樣做）。

PDF 文件的最一般結構是，按以下順序：

PDF標題
PDF 對象（文件正文）
PDF 外部參照表（目錄，給出每個 PDF 對象的文件偏移位置）
PDF預告片

您不能假設 PDF 對象在文件中的顯示順序與頁面在 PDF 查看器中的顯示順序相同。

如果您提取單個頁面，該頁面本身需要是一個有效的 PDF 文檔：包含（以相同的順序）頁眉、對象、外部參照和尾部，其中外部參照和尾部需要重新構建以匹配新文檔（外部參照和預告片不能簡單地從原始文檔中復制）。

因此，在考慮訪問生成的 PDF 的單個頁面之前，您需要完全解碼 base64 編碼的文件。

要從使用 base64 編碼的 5 頁 PDF 文檔中獲取所有單獨的 PDF 頁面作為 base64，您必須執行以下步驟：

將完整的 base64 文件解碼為有效的 5 頁 PDF 文檔。
將 5 頁 PDF 文檔拆分為 5 個單獨的 1 頁 PDF 文檔。
^{（您需要為此了解“PDF 游戲規則”，或使用知道的 PDF 庫）}
使用 base64 對每個 1 頁 PDF 文檔進行編碼。

你可能想澄清你的答案。 從您的措辭中看不出您是要在 base64 中編碼還是從中解碼。

假設你想解碼（因為你說你有 base64），有可用的標准庫： Decode Base64 data in Java

如何以字符串 Base64 格式存儲 PDF 內容

[英]How to Store PDF Content In String Base64 format

如何在android中獲取Web View的全部內容以生成PDF文件？

[英]how to get whole content of Web View to generate PDF file in android?

如何檢查“byte [] b”（保存文件內容）是否在base64中編碼..？在java中

[英]How to check a “byte[] b” (holding a file content) is encoded in base64 or not..? in java

在 POST 中將 pdf 文件作為 base64 發送

[英]Send a pdf file as base64 in POST

將PDF文件的內容轉換為Java中的Base 64，反之亦然

[英]PDF file content to Base 64 and vice versa in Java

如何將html頁面的內容轉成pdf

[英]How to the Get content of html page into pdf

如何從Java中的文件獲取base64數據URI

[英]How to get the base64 data URI from a File in Java

如何獲取音頻文件並解碼為base64字符串？

[英]How to Get an Audio File and decode to a base64 String?

如何獲取文件的base64？

[英]How can I get base64 for a file?

Okio / Okhttp使用BufferedSink下載文件並解碼Base64，而整個文件沒有多次在內存中

[英]Okio/Okhttp download file using BufferedSink and decode Base64 without having whole file in memory multiple times

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何以字符串 Base64 格式存儲 PDF 內容如何在android中獲取Web View的全部內容以生成PDF文件？如何檢查“byte [] b”（保存文件內容）是否在base64中編碼..？在java中在 POST 中將 pdf 文件作為 base64 發送將PDF文件的內容轉換為Java中的Base 64，反之亦然如何將html頁面的內容轉成pdf 如何從Java中的文件獲取base64數據URI 如何獲取音頻文件並解碼為base64字符串？如何獲取文件的base64？ Okio / Okhttp使用BufferedSink下載文件並解碼Base64，而整個文件沒有多次在內存中

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM