簡體   English   中英

如何使用Java程序提取PDF的所有屬性(紙張大小,格式,生產者)

[英]How to extract all properties (Paper Size, Format, Producer) of a PDF using java program

我可以使用Java代碼提取PDF屬性,如下所示:但是我很困惑如何使用Java代碼獲取[格式如“ PDF1.3”和頁面大小如“ A4,縱向(210×297 mm)”]屬性。

System.out.println(file.getName());
PdfReader reader = new PdfReader(file.toString());
HashMap<String, String> info = reader.getInfo(); 
char info1=reader.getPdfVersion();
byte[] b1 = reader.getMetadata();
System.out.println(info);
System.out.println(info1);

我也嘗試過PDFbox API,但我找不到相同的方法,是否可以使用Java來獲取以下屬性(我正在使用ubuntu)

我想要提取的屏幕截圖:

我想要提取的屏幕截圖

您可以使用PDFBox api PDDocument類獲取文檔信息。 PDDocumentInformation用於檢索作者,版本,創建日期,更新日期等功能。

PDDocument doc = PDDocument.load(new File(filePath));
PDDocumentInformation info = doc.getDocumentInformation();
String author = info.getAuthor();
int pages = doc.getNumberOfPages();
// String creator  = info.getCreator();
Calendar calendar = info.getCreationDate();
System.out.println("Author : " + author);
System.out.println("Created : " + new SimpleDateFormat("dd-MM-yyyy hh:mm:ss aa").format(calendar.getTimeInMillis()));
System.out.println("Total Pages : " + pages);
if(pages > 0) {
    float width = doc.getPage(0).getMediaBox().getWidth();
    float height = doc.getPage(0).getMediaBox().getHeight();
    System.out.println("Page 0 size : " + width + " * " + height);
} else {
    System.err.println("No pages.");
}

編輯

這是獲取頁面格式的鏈接。

這是獲取頁面信息作者的鏈接。

希望能對您有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM