繁体 English 中英

如何从PDF图像中提取文本

[英]How to extract text from PDF image

原文 2018-05-12 23:00:45 3 3 java/ pdf/ ocr/ tesseract/ tess4j

我想从具有图像的PDF中提取数据，图像的形式是字母将在小方框内，例如name : test ，这里的每个单词都将在方框内。

我尝试过tesseract OCR无法获得理想的结果。

我曾尝试商业ABBYY可以工作，但是我想使用基于Java的免费API。

下面是例子

3 个解决方案

免费的Nicomsoft OCR SDK已从我的PDF中提取了文本，效果令人满意

它支持非常大的技术，现在我正在尝试将其集成到我的应用程序中

链接https://www.nicomsoft.com/

就OCR中的免费而言，Tesseract尽其所能。

或者，您可以查看Windows 10 UWP OCR产品。

我不确定那里有免费的，但是您绝对可以尝试TotalPDFConverterOCR

它具有广泛的功能，例如转换为doc，图像等。

从pdf文件中提取具有文本的文本和图像

[英]Extract text and image having text from pdf file

从pdf文件中提取文本

[英]extract text from a pdf file

从pdf文件中提取文本

[英]extract text from pdf files

从书签中提取PDF中的文本

[英]Extract text from PDF at bookmark

从图像中提取文本

[英]extract text from image

从图像中提取文本

[英]extract text from image

如何在Java中从图像中提取文本？

[英]How to Extract text from image in java?

如何从扫描的PDF文件创建和提取图像（Java）

[英]How to create and extract an image from a scanned PDF file (Java)

如何使用Apache PDFBox从PDF文件中提取文本

[英]How to extract text from a PDF file with Apache PDFBox

如何使用pdfbox从pdf中提取粗体文本？

[英]How to extract bold text from pdf using pdfbox?

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 从pdf文件中提取具有文本的文本和图像从pdf文件中提取文本从pdf文件中提取文本从书签中提取PDF中的文本从图像中提取文本从图像中提取文本如何在Java中从图像中提取文本？如何从扫描的PDF文件创建和提取图像（Java）如何使用Apache PDFBox从PDF文件中提取文本如何使用pdfbox从pdf中提取粗体文本？

相关标签

如何从PDF图像中提取文本

问题描述

3 个解决方案

解决方案1
1 已采纳 2018-06-07 21:23:03

解决方案2
0 2018-05-12 23:20:55

解决方案3
0 2018-05-14 10:43:02

如何从PDF图像中提取文本

问题描述

3 个解决方案

解决方案1 1 已采纳 2018-06-07 21:23:03

解决方案2 0 2018-05-12 23:20:55

解决方案3 0 2018-05-14 10:43:02

解决方案1
1 已采纳 2018-06-07 21:23:03

解决方案2
0 2018-05-12 23:20:55

解决方案3
0 2018-05-14 10:43:02