繁体   English   中英

如何从PDF图像中提取文本

[英]How to extract text from PDF image

我想从具有图像的PDF中提取数据,图像的形式是字母将在小方框内,例如name : test ,这里的每个单词都将在方框内。

我尝试过tesseract OCR无法获得理想的结果。

我曾尝试商业ABBYY可以工作,但是我想使用基于Java的免费API。

下面是例子 在此处输入图片说明

免费的Nicomsoft OCR SDK已从我的PDF中提取了文本,效果令人满意

它支持非常大的技术,现在我正在尝试将其集成到我的应用程序中

链接https://www.nicomsoft.com/

就OCR中的免费而言,Tesseract尽其所能。

或者,您可以查看Windows 10 UWP OCR产品

我不确定那里有免费的,但是您绝对可以尝试TotalPDFConverterOCR

它具有广泛的功能,例如转换为doc,图像等。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM