繁体   English   中英

如何从java中的pdf文件中提取结构化信息

[英]how to extract structured informaion from pdf file in java

我需要从pdf文件中提取表格,我知道它不是以表格格式存储的,但是我想从java中的pdf中读取学生结果,如果有人知道的话,请帮助。

您应该为此使用PDF解析器。 查看此Java开源PDF库列表

SOme PDF文件包含PDF结构化文本(http://www.jpedal.org/PDFblog/2010/09/the-easy-way-to-discover-if-a-pdf-file-contains-structured-content/)。 如果不这样做,则取决于解析器的试探法来猜测这一点并添加结构。

PdfBox开发人员在表上做了很多工作,但绝不可能是完美的

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM