有没有办法避免在 iText 7 中加载 XMP 元数据？

Question

我有一个包含大量 xmp 元数据的 PDF 文件。 当我使用itext7处理它时，程序卡在语句var pdfdocument origpdf = new pdfdocument (pdfreader); 查看源码发现open(null)方法是在Pdfdocument对象的构造函数中执行的，最后卡在reader.pdfaconformancelevel = pdfaconformancelevel.getconformancelevel (xmpmatafactory. Parsefrombuffer (xmpmetadata)); 并且没有办法避免它，xmp 元数据对我来说毫无用处。

使用 itextSharp，基于Remove XMP Metadata on PDF/A ，我可以获得没有元数据的 pdf 文件。

PdfReader reader = new PdfReader(src);
PdfDictionary dict = reader.Catalog;
dict.Remove(PdfName.METADATA);
dict.Remove(PdfName.PROPERTIES);
reader.RemoveUnusedObjects();
PdfStamper stamper = new PdfStamper(reader, new FileStream(target, FileMode.Create, FileAccess.ReadWrite));
stamper.Close();

我尝试创建 PdfReader 或 PdfDocument 的子类，以尝试干扰加载元数据，但都失败了。

使用itext7，有什么办法可以避免加载元数据？ 或者有什么方法可以删除 XMP 元数据？

Answer 1

这是您可以覆盖PdfReader并跳过读取元数据对象的方法。 事实上，对象被读取，但我们读者会表现得好像没有元数据一样，它不会告诉任何人它存在。

自定义PdfReader实现：

private static class MetadataFreePdfReader extends PdfReader {
    public MetadataFreePdfReader(String filename) throws IOException {
        super(filename);
    }

    @Override
    protected PdfObject readObject(PdfIndirectReference reference) {
        PdfObject obj = super.readObject(reference);
        if (obj instanceof PdfStream && PdfName.Metadata.equals(((PdfStream) obj).getAsName(PdfName.Type))) {
            // skip metadata object
            return null;
        }
        return obj;
    }
}

这是将重载实例传递给PdfDocument ：

PdfDocument pdfDocument = new PdfDocument(new MetadataFreePdfReader("C:/path/to/140mmX90mm-2000BGJCV1M.pdf"));

有没有办法避免在 iText 7 中加载 XMP 元数据？

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-03-28 18:07:00

有没有办法避免在 iText 7 中加载 XMP 元数据？

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-03-28 18:07:00

解决方案1
1 已采纳 2020-03-28 18:07:00