PDFBox：ExtractImages JPEG2000 圖像未提取

Question

我正在嘗試使用 PDFBox 提取 PDF 文件中的所有圖像。 它適用於包含 jpeg 和 png 圖像的 pdf。 但它不適用於 OpenJPEG2000 圖像。 我收到以下異常：收到以下錯誤：

org.apache.pdfbox.contentstream.PDFStreamEngine operatorException
SEVERE: Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed

在所有版本的 PDFBox 中，都會出現相同的異常。 也嘗試過獨立 jar。

我也在 pom.xml 中包含了必要的依賴項。

<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>jbig2-imageio</artifactId>
</dependency>
<!-- For legal reasons (incompatible license), these two dependencies
are to be used only in the tests and may not be distributed. -->
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-core</artifactId>
</dependency>
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-jpeg2000</artifactId>
</dependency>

任何幫助將不勝感激。

Answer 1

將鏡像相關的 .jar 文件復制到 lib 子目錄中，然后使用以下命令行：

java -cp "pdfbox-app-2.0.21.jar;lib/*" org.apache.pdfbox.tools.PDFBox ExtractImages <parameters>

用 ”;” 在 Windows 上，“:”在 linux 上。

org.apache.pdfbox.tools.PDFBox是主類的名稱。

PDFBox：ExtractImages JPEG2000 圖像未提取

問題描述

1 個解決方案

解決方案1
1 2020-10-13 07:49:27

PDFBox：ExtractImages JPEG2000 圖像未提取

問題描述

1 個解決方案

解決方案1 1 2020-10-13 07:49:27

解決方案1
1 2020-10-13 07:49:27