繁体 English 中英

OCR应用前的图像清洁

[英]Image cleaning before OCR application

原文 2013-10-28 16:08:46 0 3 python/ image-processing/ ocr

我在过去的几个小时里一直在试验PyTesser，这是一个非常好的工具。 我注意到有关PyTesser准确性的一些事情：

带有图标，图像和文本的文件 - 准确率为5-10％
仅包含文本的文件（图像和图标已擦除） - 准确率为50-60％
带拉伸的文件（这是最好的部分） - 在x或y轴上面的2）拉伸文件将精度提高了10-20％

显然Pytesser并不关心字体尺寸或图像拉伸。 虽然有很多关于图像处理和OCR的理论需要阅读，但是在应用PyTesser或其他库之前，是否有任何标准的图像清理程序（除了擦除图标和图像），而不管语言是什么？

...........

哇，这篇文章现在已经很老了。 在过去的几天里，我再次开始研究OCR。 这次我扔掉了PyTesser并使用了Tesseract引擎和ImageMagik。 直截了当地说，这就是我发现的：

1) You can increase the resolution with ImageMagic(There are a bunch of simple shell commands you can use)
2) After increasing the resolution, the accuracy went up by 80-90%.

因此，Tesseract Engine毫无疑问是市场上最好的开源OCR引擎。 此处不需要事先清洁图像。 需要注意的是，它不适用于包含大量嵌入图像的文件，而且我没有找到一种方法来训练Tesseract忽略它们。 此外，图像中的文本布局和格式也有很大的不同。 它只适用于带有文本的图像。 希望这有帮助。

3 个解决方案

不确定你的意图是否用于商业用途，但是如果你在一堆像图像上执行OCR，这会产生奇迹。

http://www.fmwconcepts.com/imagemagick/textcleaner/index.php

原版的

在使用给定参数进行预处理之后。

在使用给定参数进行预处理之后。

事实证明， tesseract wiki有一篇文章以我能想象的最佳方式回答这个问题：

关于“提高[OCR]输出质量”的插图指南。
问题“提高tesseract OCR准确度的图像处理”也可能是有意义的。

（初步答案，仅供记录）

我没有使用PyTesser ，但我已经用tesseract做了一些实验（版本： 3.02.02 ）。

如果在彩色图像上调用tesseract，则它首先应用全局Otsu方法对其进行二值化，然后在二进制（黑白）图像上运行实际字符识别。

图片来自： http ： //scikit-image.org/docs/dev/auto_examples/plot_local_otsu.html

大津的门槛图

可以看出，“全球大津”可能并不总能产生理想的结果。

为了更好地理解tesseract'看到'是将Otsu的方法应用于您的图像，然后查看生成的图像。

总之：提高识别率的最直接的方法是自己对图像进行二值化（最有可能通过反复试验找到好的阈值） ，然后将这些二值化图像传递给tesseract 。

有人非常友好地发布了tesseract的api文档，因此可以验证以前有关处理管道的语句： ProcessPage - > GetThresholdedImage - > ThresholdToPix - > OtsuThresholdRectToPix

我知道这不是一个完美的答案。 但我想与您分享我从PyCon 2013中看到的可能适用的视频。 它有点缺乏实现细节，但对于如何解决/改善您的问题可能只是一些指导/启发。

链接到视频

链接到演示文稿

如果您决定使用ImageMagick预处理源图像。 这是一个问题，指出你很好的python绑定。

在旁注。 Tesseract非常重要。 你需要训练它，否则它不会像它能够那样好/准确。

用于 OCR 的清洁图像

[英]Cleaning image for OCR

OCR 的背景图像清理

[英]Background image cleaning for OCR

OpenCV：OCR 前阴影图像的轮廓检测

[英]OpenCV: Contour detection of shadowed image before OCR

将图像清洁成仅黑色

[英]Cleaning an image to only black

清理验证码图像

[英]Cleaning up captcha image

为 MNIST OCR 预处理图像

[英]Preprocessing an image for MNIST OCR

为 OCR 拆分多列图像

[英]Splitting multicolumn image for OCR

检测和分割 OCR 的图像

[英]detect and split image for OCR

准备用于OCR的图像

[英]Prepare Image for OCR

增强OCR的图像

[英]Enhancement of Image for OCR

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 用于 OCR 的清洁图像 OCR 的背景图像清理 OpenCV：OCR 前阴影图像的轮廓检测将图像清洁成仅黑色清理验证码图像为 MNIST OCR 预处理图像为 OCR 拆分多列图像检测和分割 OCR 的图像准备用于OCR的图像增强OCR的图像

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM