[英]Best API for reading a huge .pdf file from java
我有一個巨大的pdf文件(20 mb / 800頁),其中包含一些信息。
它具有超鏈接索引。 另外,其余大多數信息都是表格格式(pdf)。 我需要使用Java檢索此信息並將其存儲在SQL Server中。
哪種最佳的API可從Java讀取此類文件?
由於PDF不包含結構信息,除非在創建時明確添加,否則它不太可能在PDF內采用表格格式。 我寫了一篇文章,解釋了從http://www.jpedal.org/PDFblog/2009/04/pdf-text/從PDF提取文本的一些問題。
您是否嘗試過iText :
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.