[英]how to extract structured informaion from pdf file in java
我需要从pdf文件中提取表格,我知道它不是以表格格式存储的,但是我想从java中的pdf中读取学生结果,如果有人知道的话,请帮助。
您应该为此使用PDF解析器。 查看此Java开源PDF库列表 。
SOme PDF文件包含PDF结构化文本(http://www.jpedal.org/PDFblog/2010/09/the-easy-way-to-discover-if-a-pdf-file-contains-structured-content/)。 如果不这样做,则取决于解析器的试探法来猜测这一点并添加结构。
PdfBox开发人员在表上做了很多工作,但绝不可能是完美的
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.