PDFBox：ExtractImages JPEG2000 图像未提取

Question

我正在尝试使用 PDFBox 提取 PDF 文件中的所有图像。 它适用于包含 jpeg 和 png 图像的 pdf。 但它不适用于 OpenJPEG2000 图像。 我收到以下异常：收到以下错误：

org.apache.pdfbox.contentstream.PDFStreamEngine operatorException
SEVERE: Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed

在所有版本的 PDFBox 中，都会出现相同的异常。 也尝试过独立 jar。

我也在 pom.xml 中包含了必要的依赖项。

<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>jbig2-imageio</artifactId>
</dependency>
<!-- For legal reasons (incompatible license), these two dependencies
are to be used only in the tests and may not be distributed. -->
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-core</artifactId>
</dependency>
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-jpeg2000</artifactId>
</dependency>

任何帮助将不胜感激。

Answer 1

将镜像相关的 .jar 文件复制到 lib 子目录中，然后使用以下命令行：

java -cp "pdfbox-app-2.0.21.jar;lib/*" org.apache.pdfbox.tools.PDFBox ExtractImages <parameters>

用 ”;” 在 Windows 上，“:”在 linux 上。

org.apache.pdfbox.tools.PDFBox是主类的名称。

PDFBox：ExtractImages JPEG2000 图像未提取

问题描述

1 个解决方案

解决方案1
1 2020-10-13 07:49:27

PDFBox：ExtractImages JPEG2000 图像未提取

问题描述

1 个解决方案

解决方案1 1 2020-10-13 07:49:27

解决方案1
1 2020-10-13 07:49:27