繁体   English   中英

Tesseract C#:在我的情况下什么也找不到

[英]Tesseract c# : Find nothing in my case

我为tesseract添加了C#包装器: TesseractEngine

我有两种图像要读取:

在此处输入图片说明

第二种类型(仅一个字母):

在此处输入图片说明

但是在两种情况下,Tesseract返回空字符串。

这是我的代码(在docs中找到):

    public static void Main(string[] args)
        {
        var testImagePath = @"C:\plate\ExtractLicensePlate-0.jpg";
        if (args.Length > 0)
        {
            testImagePath = args[0];
        }

        try
        {
            using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
            {
                engine.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789");

                using (var img = Pix.LoadFromFile(testImagePath))
                {
                    using (var page = engine.Process(img))
                    {
                        var text = page.GetText();//<-- empty :(

                    }
                }
            }
        }
        catch (Exception e)
        {                
            Console.WriteLine(e.ToString());
            Console.Read();
        }
        Console.Write("Press any key to continue . . . ");
        Console.ReadKey(true);
    }

也许我错过了选择权或其他?

编辑:我已经尝试过这种方法,但没有成功:

在此处输入图片说明

编辑2:我已经尝试过灰色,黑白和Tesseract给我:EEEEEEE

在此处输入图片说明

我不知道我能做得更好...:

  1. 我建议将图像转换为灰度
  2. 尝试将PageSegMode设置为SingleCharSingleWord

      using (var page = engine.Process(img, PageSegMode.SingleChar)) { var text = page.GetText(); } 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM