[英]How to extract text from PDF image
我想从具有图像的PDF中提取数据,图像的形式是字母将在小方框内,例如name : test ,这里的每个单词都将在方框内。
name : test
我尝试过tesseract OCR无法获得理想的结果。
我曾尝试商业ABBYY可以工作,但是我想使用基于Java的免费API。
下面是例子
免费的Nicomsoft OCR SDK已从我的PDF中提取了文本,效果令人满意
它支持非常大的技术,现在我正在尝试将其集成到我的应用程序中
链接https://www.nicomsoft.com/
就OCR中的免费而言,Tesseract尽其所能。
或者,您可以查看Windows 10 UWP OCR产品 。
我不确定那里有免费的,但是您绝对可以尝试TotalPDFConverterOCR
它具有广泛的功能,例如转换为doc,图像等。
[英]Extract text and image having text from pdf file
[英]extract text from a pdf file
[英]extract text from pdf files
[英]Extract text from PDF at bookmark
[英]extract text from image
[英]How to Extract text from image in java?
[英]How to create and extract an image from a scanned PDF file (Java)
[英]How to extract text from a PDF file with Apache PDFBox
[英]How to extract bold text from pdf using pdfbox?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.