PDF Box由於其中包含JBIG2圖像而生成空白圖像

Question

首先讓我概述一下我的項目。 我有一個pdf文件，我需要使用PDFBox API轉換為圖像（一張圖像一張），然后使用PDFBox API本身將所有這些圖像寫入新的pdf文件中。 基本上，將pdf轉換為pdf，我們稱為PDF轉碼。

對於某些包含JBIG2圖像的pdf， convertToImage()方法的PDFbox實現會無提示地失敗，沒有任何異常或錯誤，最終生成PDF，但是這次僅包含空白內容（白色）。 我在控制台上收到的消息是：

Dec 06, 2013 5:15:42 PM org.apache.pdfbox.filter.JBIG2Filter decode
SEVERE: Can't find an ImageIO plugin to decode the JBIG2 encoded datastream.
Dec 06, 2013 5:15:42 PM org.apache.pdfbox.pdmodel.graphics.xobject.PDPixelMap getRGBImage
SEVERE: Something went wrong ... the pixelmap doesn't contain any data.
Dec 06, 2013 5:15:42 PM org.apache.pdfbox.util.operator.pagedrawer.Invoke process
WARNING: getRGBImage returned NULL

我需要知道如何解決此問題？ 我們有類似的東西：

import org.apache.pdfbox.filter.JBIG2Filter;

我不知道如何實現。

我正在搜索，但無濟於事。 有人可以建議嗎？

Answer 1

在PDFBox https://issues.apache.org/jira/browse/PDFBOX-1067中查看此票證。 我認為您的問題的答案是：

確保已為您的Java版本安裝了JAI和JAI-ImageIO插件：此處提供了不錯的安裝說明： http : //docs.geoserver.org/latest/zh/user/production/java.html
以使用JBIG2-imageio插件（新版本已獲得Apache2許可的許可） https://github.com/levigo/jbig2-imageio/

Answer 2

我有同樣的問題。 我從jbig2-imageio下載了jar，然后將其包含在項目的應用程序庫中，並且開箱即用。 正如亞當所說，它使用GPL3。

Answer 3

似乎不需要安裝JAI。 我只需要下載levigo-jbig2-imageio-1.6.5.jar，將其放置在我的依賴關系罐的文件夾中，然后在eclipse中將其添加到Java構建路徑庫中即可。 https://github.com/levigo/jbig2-imageio/

Answer 4

我遇到了同樣的問題，並通過在pom.xml中添加此依賴項來解決此問題：

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>jbig2-imageio</artifactId>
    <version>3.0.2</version>
</dependency>

祝好運。

Answer 5

import java.awt.image.BufferedImage
import org.apache.pdfbox.cos.COSName

import org.apache.pdfbox.pdmodel.PDDocument
import org.apache.pdfbox.pdmodel.PDPage
import org.apache.pdfbox.pdmodel.PDPageTree
import org.apache.pdfbox.pdmodel.PDResources
import org.apache.pdfbox.pdmodel.graphics.PDXObject
import org.apache.pdfbox.rendering.ImageType
import org.apache.pdfbox.rendering.PDFRenderer
import org.apache.pdfbox.tools.imageio.ImageIOUtil


import javax.imageio.ImageIO
import javax.imageio.spi.IIORegistry
import javax.imageio.spi.ImageReaderSpi
import javax.swing.*
import javax.swing.filechooser.FileNameExtensionFilter

public class savePDFAsImage{

    String path = "c:/pdfImage/"

    //allow pdf file selection for extracting
    public static File selectPDF() {
        File file = null
        JFileChooser chooser = new JFileChooser()
        FileNameExtensionFilter filter = new FileNameExtensionFilter("PDF", "pdf")
        chooser.setFileFilter(filter)
        chooser.setMultiSelectionEnabled(false)
        int returnVal = chooser.showOpenDialog(null)
        if (returnVal == JFileChooser.APPROVE_OPTION) {
            file = chooser.getSelectedFile()
           println "Please wait..."
        }
        return file
    }

    public static void main(String[] args) {
        try {
 // help to view list of plugin registered. check by adding JBig2 plugin and JAI plugin
            ImageIO.scanForPlugins()
            IIORegistry reg = IIORegistry.getDefaultInstance()
            Iterator spIt = reg.getServiceProviders(ImageReaderSpi.class, false)
            spIt.each(){
                println it.getProperties()
            }
            testPDFBoxSaveAsImage()
            testPDFBoxExtractImagesX()
        } catch (Exception e) {
            e.printStackTrace()
        }
    }    

    public static void testPDFBoxExtractImagesX() throws Exception {
        PDDocument document = PDDocument.load(selectPDF())
        PDPageTree list = document.getPages()
        for (PDPage page : list) {
            PDResources pdResources = page.getResources()
            for (COSName c : pdResources.getXObjectNames()) {
                PDXObject o = pdResources.getXObject(c)
                if (o instanceof org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject) {
                    File file = new File( + System.nanoTime() + ".png")
                    ImageIO.write(((org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject) o).getImage(), "png", file)
                }
            }
        }
        document.close()
        println "Extraction complete"
    }
    public static void testPDFBoxSaveAsImage() throws Exception {
        PDDocument document = PDDocument.load(selectPDF().getBytes())
        PDFRenderer pdfRenderer = new PDFRenderer(document)
        for (int page = 0; page < document.getNumberOfPages(); ++page) {
            BufferedImage bim = pdfRenderer.renderImageWithDPI(page,300, ImageType.BINARY)
            // suffix in filename will be used as the file format
            OutputStream fileOutputStream = new FileOutputStream(+ System.nanoTime() + ".png")
            boolean b = ImageIOUtil.writeImage(bim, "png",fileOutputStream,300)
        }
        document.close()
        println "Extraction complete"
    }
}

PDF Box由於其中包含JBIG2圖像而生成空白圖像

問題描述

5 個解決方案

解決方案1
10 已采納 2014-01-10 23:20:16

解決方案2
3 2015-02-11 16:21:58

解決方案3
1 2015-08-15 13:35:19

解決方案4
1 2019-07-09 18:45:41

解決方案5
0 2017-03-20 19:07:15

PDF Box由於其中包含JBIG2圖像而生成空白圖像

問題描述

5 個解決方案

解決方案1 10 已采納 2014-01-10 23:20:16

解決方案2 3 2015-02-11 16:21:58

解決方案3 1 2015-08-15 13:35:19

解決方案4 1 2019-07-09 18:45:41

解決方案5 0 2017-03-20 19:07:15

解決方案1
10 已采納 2014-01-10 23:20:16

解決方案2
3 2015-02-11 16:21:58

解決方案3
1 2015-08-15 13:35:19

解決方案4
1 2019-07-09 18:45:41

解決方案5
0 2017-03-20 19:07:15