如何在tess4j版本4.1。*中將字符列入白名單

Question

目的是從圖像中讀取數字特定的數據（1,2，...，9,0）。 為此，我使用的是Tess4j 4.1.1版。

<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.1.1</version>
</dependency>

我的示例代碼如下：

ImageIO.read(new File("c:\\temp\\number1.jpg"));
ITesseract instance = new Tesseract();
instance.doOCR(img);

但是由於某種原因，它把一些數字誤認為是字母。 因此，為了最大程度地減少錯誤，我只需要將數字列入白名單。

由於這在早期版本Tess4j（3.0。**）用有可能TessBaseAPI ，但在目前的4.1。*版本是不可用的。 有人可以在這里幫助我，如何在TessAPI 4.1。*及更高版本中設置白名單字符？

Answer 1

自Tesseract 4.00-alpha起，該功能已損壞。 尚未修復。

https://github.com/tesseract-ocr/tesseract/issues/751

如何在tess4j版本4.1。*中將字符列入白名單

問題描述

1 個解決方案

解決方案1
0 2018-08-06 14:16:55

如何在tess4j版本4.1。*中將字符列入白名單

問題描述

1 個解決方案

解決方案1 0 2018-08-06 14:16:55

解決方案1
0 2018-08-06 14:16:55