簡體   English   中英

如何在java中閱讀pdf文件

[英]How to read pdf file in java

我正在研究一個需要讀取pdf文件的java項目。

我知道可以使用像itext這樣的外部庫。

但是有可能使用java inbuild功能讀取pdf文件而不使用任何外部庫嗎?

對的,這是可能的。 從java經過Apache PDFBOX讀取pdf文件。 此PDFBOX允許創建新的PDF文檔,處理現有文檔以及從文檔中提取內容的功能。 Apache PDFBox還包括幾個命令行實用程序。

您可以使用Apache PDFBox恢復PDF文件的文本。 在maven項目pom.xml中,我們必須添加依賴性

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.8</version>
</dependency>

編碼:

try {
    DLFileEntry fileEntry = DLFileEntryLocalServiceUtil.getFileEntry(folder.getGroupId(), folder.getFolderId(), fileName);
    File file = DLFileEntryLocalServiceUtil.getFile(themeDisplay.getUserId(), fileEntry.getFileEntryId(), fileEntry.getVersion(), true);
    PDDocument pddDocument=PDDocument.load(file);
    PDFTextStripper textStripper = new PDFTextStripper();
    String text = textStripper.getText(pddDocument);
} catch (Exception e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
}

要閱讀/創建PDF,請參閱文檔:

https://pdfbox.apache.org/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM