繁体   English   中英

tesseract-ocr 是否执行任何图像预处理?

[英]Does tesseract-ocr perform any image pre-processing?

我目前正在使用 Tesseract OCR 引擎,我将它与 OpenCV 结合使用以在将图像发送到 OCR 引擎之前对其进行预处理。 但是,我想知道 Tesseract 本身是否在提取文本之前执行了一些图像预处理。 如果是,那么 Tesseract 实现的方法是什么?

我的目标是确保我不执行多余的预处理方法。 我执行的一些预处理方法是自适应阈值和高斯模糊。

任何帮助/指导将不胜感激!

编辑:我知道 Tesseract 进行基本的图像预处理。 我想知道是否可以绕过这些方法并直接输入我手动处理的图像。 (再次,为了避免对图像进行冗余处理)?

Tesseract 使用 Leptonica 库进行各种预处理操作,如 Otsu 二值化算法、膨胀、腐蚀等。 但是由于操作不依赖于您的数据,因此在某些情况下会导致不良结果。 欲了解更多信息,请阅读此页面

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM