繁体 English 中英

如何使用Java从PDF中的特定矩形区域提取数据？

[英]How to extract data from a specific rectangular area in a PDF using Java?

原文 2017-12-26 00:21:20 5 1 java/ pdf

我正在尝试从PDF内给出的两个坐标所指定的特定矩形区域中提取数据。 是否可以用PDF进行此操作，还是必须将其转换为图像并使用OCR？ 如果是这样，PDFBox或iText是否包括通过OCR分析图像的方法？ 谢谢！

1 个解决方案

如果区域是文本。 使用pdfbox ，

PDDocument document = PDDocument.load(new File("target.pdf"));
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition(true);
Rectangle rect = new Rectangle(35, 375, 340, 204);
stripper.addRegion("class1", rect);
stripper.extractRegions(document.getPage(1));
System.out.println(stripper.getTextForRegion("class1")

Java：如何使用iText从PDF文件中选择区域提取文本？

[英]Java: How to extract text by a selected area from a PDF file using iText?

如何使用Java从PDF提取数据并将其分为特定类别

[英]How to extract data from PDF and split into particluar categories using java

如何使用 Java 从 pdf 中提取图像（不使用 pdfbox）

[英]How to extract images from pdf using Java (not using pdfbox)

如何使用 Java 使用 PDFExtStream 从 PDF 中提取文本

[英]How to extract text from PDF using PDFExtStream using Java

如何从Java中的PDF文件中提取表格数据

[英]How to extract tabular data from a PDF file in Java

使用Java和IText，如何从PDF中提取AcroForm字段名称？

[英]Using Java and IText, how to extract AcroForm field names from a PDF?

如何使用Java代码和pdfbox从pdf文件中提取参数

[英]How to extract parameter from pdf file using java code & pdfbox

用Java将数据从ODT提取到PDF

[英]Extract Data from ODT to PDF in Java

如何使用java从网站中提取数据？

[英]How to extract the data from a website using java?

如何使用JPedal从pdf文件中提取数据？

[英]How to extract data from a pdf file using JPedal?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Java：如何使用iText从PDF文件中选择区域提取文本？如何使用Java从PDF提取数据并将其分为特定类别如何使用 Java 从 pdf 中提取图像（不使用 pdfbox）如何使用 Java 使用 PDFExtStream 从 PDF 中提取文本如何从Java中的PDF文件中提取表格数据使用Java和IText，如何从PDF中提取AcroForm字段名称？如何使用Java代码和pdfbox从pdf文件中提取参数用Java将数据从ODT提取到PDF 如何使用java从网站中提取数据？如何使用JPedal从pdf文件中提取数据？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM