[英]How to read pdf file in java
我正在研究一個需要讀取pdf文件的java項目。
我知道可以使用像itext這樣的外部庫。
但是有可能使用java inbuild功能讀取pdf文件而不使用任何外部庫嗎?
對的,這是可能的。 從java經過Apache PDFBOX讀取pdf文件。 此PDFBOX允許創建新的PDF文檔,處理現有文檔以及從文檔中提取內容的功能。 Apache PDFBox還包括幾個命令行實用程序。
您可以使用Apache PDFBox恢復PDF文件的文本。 在maven項目pom.xml中,我們必須添加依賴性
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.8</version>
</dependency>
編碼:
try {
DLFileEntry fileEntry = DLFileEntryLocalServiceUtil.getFileEntry(folder.getGroupId(), folder.getFolderId(), fileName);
File file = DLFileEntryLocalServiceUtil.getFile(themeDisplay.getUserId(), fileEntry.getFileEntryId(), fileEntry.getVersion(), true);
PDDocument pddDocument=PDDocument.load(file);
PDFTextStripper textStripper = new PDFTextStripper();
String text = textStripper.getText(pddDocument);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
要閱讀/創建PDF,請參閱文檔:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.