簡體   English   中英

用於PDF比較的iText API

[英]iText API for PDF comparison

我可以使用iText API比較兩個PDF文件嗎? 我已經在stackoverflow上采用了各種方法來比較PDF文件(例如工具),一些實用程序(例如imagemagick等)。我要比較的PDF是帶有圖形,表格和文本等的財務報告。我們必須比較大量文件並希望通過命令行實用程序來完成。 有一個ComparePDF命令行工具,但是它只是輸出兩個文件是否包含差異。 我們將要打印文件差異的日志。 我們可以通過iText完成此操作嗎?

您想比較什么? iText可以用來比較結構和語法,但是...兩個看上去與人眼相同的不同PDF在內部可能具有完全不同的結構和語法。

在iText上,我們編寫了使用GhostScript創建每個頁面圖像的JUnit測試。 這些圖像在每個像素的基礎上相互比較。

我們還在JUnit測試中使用了iText,但是這些測試更關注結構和語法,而不是內容。

您需要使用Myers O(ND)diff算法進行PDF比較,itext或pdfbox api不提供pdf比較方法,您可以使用itext提取這些文件的文本並進行坐標處理,以后再使用Myers O(ND)diff找出差異並突出顯示變化的算法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM