[英]Is there any way to avoid loading XMP metadata in iText 7?
我有一个包含大量 xmp 元数据的 PDF 文件。 当我使用itext7处理它时,程序卡在语句var pdfdocument origpdf = new pdfdocument (pdfreader);
查看源码发现open(null)方法是在Pdfdocument对象的构造函数中执行的,最后卡在reader.pdfaconformancelevel = pdfaconformancelevel.getconformancelevel (xmpmatafactory. Parsefrombuffer (xmpmetadata));
并且没有办法避免它,xmp 元数据对我来说毫无用处。
使用 itextSharp,基于Remove XMP Metadata on PDF/A ,我可以获得没有元数据的 pdf 文件。
PdfReader reader = new PdfReader(src);
PdfDictionary dict = reader.Catalog;
dict.Remove(PdfName.METADATA);
dict.Remove(PdfName.PROPERTIES);
reader.RemoveUnusedObjects();
PdfStamper stamper = new PdfStamper(reader, new FileStream(target, FileMode.Create, FileAccess.ReadWrite));
stamper.Close();
我尝试创建 PdfReader 或 PdfDocument 的子类,以尝试干扰加载元数据,但都失败了。
使用itext7,有什么办法可以避免加载元数据? 或者有什么方法可以删除 XMP 元数据?
这是您可以覆盖PdfReader
并跳过读取元数据对象的方法。 事实上,对象被读取,但我们读者会表现得好像没有元数据一样,它不会告诉任何人它存在。
自定义PdfReader
实现:
private static class MetadataFreePdfReader extends PdfReader {
public MetadataFreePdfReader(String filename) throws IOException {
super(filename);
}
@Override
protected PdfObject readObject(PdfIndirectReference reference) {
PdfObject obj = super.readObject(reference);
if (obj instanceof PdfStream && PdfName.Metadata.equals(((PdfStream) obj).getAsName(PdfName.Type))) {
// skip metadata object
return null;
}
return obj;
}
}
这是将重载实例传递给PdfDocument
:
PdfDocument pdfDocument = new PdfDocument(new MetadataFreePdfReader("C:/path/to/140mmX90mm-2000BGJCV1M.pdf"));
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.