繁体 English 中英

python-tesseract OCR：仅获取数字

[英]python-tesseract OCR: get digits only

原文 2012-03-20 20:01:45 4 1 python/ tesseract

我正在使用tesseract OCR with python-tesseract。 在tesseract FAQ中，关于数字，我们有：

使用

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

在调用Init函数之前或将其放在名为tessdata / configs / digits的文本文件中：

tessedit_char_whitelist 0123456789

然后你的命令行变成：

tesseract image.tif outputbase nobatch digits

警告：在旧的和新的配置变量合并之前，您还必须具有nobatch参数。

在python-tesseract中，存在SetVariable方法。 我试过这个，但是OCR的结果是一样的：

api = tesseract.TessBaseAPI()
api.SetVariable("tessedit_char_whitelist", "0123456789")
api.Init('.','eng',tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)

有没有人已经有这个工作，或者我应该认为它是python-tesseract中的一个错误？

1 个解决方案

好的，搞定了。 根据tesseract-ocr的这个（非官方？）文档，必须在Init（）之后调用SetVariable（），即使官方常见问题解答中说的相反。 在Init（）之后调用它按预期工作。

如何修复 python-tesseract OCR 中的字母混淆？

[英]How can I fix letter confusion in python-tesseract OCR?

在 Ubuntu 上安装 Python-tesseract

[英]Python-tesseract installation on Ubuntu

访问python-tesseract的信心

[英]Access confidence in python-tesseract

在Linux系统上安装Python-Tesseract

[英]Installing Python-Tesseract on a Linux system

树莓派python-tesseract安装

[英]raspberry pi python-tesseract install

Python-tesseract无法识别任何内容

[英]Python-tesseract does not recognize anything

Tesseract-OCR 无法识别数字

[英]Tesseract-OCR not recognizing digits

(OCR) Tesseract 无法识别简单数字

[英](OCR) Tesseract not recognizing simple digits

python tesseract获取没有OCR的行数

[英]python tesseract get number of lines without OCR

带python和tesseract的OCR

[英]OCR with python and tesseract

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何修复 python-tesseract OCR 中的字母混淆？在 Ubuntu 上安装 Python-tesseract 访问python-tesseract的信心在Linux系统上安装Python-Tesseract 树莓派python-tesseract安装 Python-tesseract无法识别任何内容 Tesseract-OCR 无法识别数字 (OCR) Tesseract 无法识别简单数字 python tesseract获取没有OCR的行数带python和tesseract的OCR

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM