[英]How to whitelist characters in tess4j version 4.1.*
目的是從圖像中讀取數字特定的數據(1,2,...,9,0)。 為此,我使用的是Tess4j 4.1.1版。
<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.1.1</version>
</dependency>
我的示例代碼如下:
ImageIO.read(new File("c:\\temp\\number1.jpg"));
ITesseract instance = new Tesseract();
instance.doOCR(img);
但是由於某種原因,它把一些數字誤認為是字母。 因此,為了最大程度地減少錯誤,我只需要將數字列入白名單。
由於這在早期版本Tess4j(3.0。**)用有可能TessBaseAPI ,但在目前的4.1。*版本是不可用的。 有人可以在這里幫助我,如何在TessAPI 4.1。*及更高版本中設置白名單字符?
自Tesseract 4.00-alpha起,該功能已損壞。 尚未修復。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.