繁体   English   中英

如何在tesseract中使用所有可用的语言?

[英]How to make use of all available languages in tesseract?

我想创建一个简单的 WPF 程序,用于使用 tesseract 进行 OCR 扫描,用户可以在其中选择要扫描的语言。² 现在出于某种原因,tesseract 希望有一个 tessdata 文件夹,其中直接包含语言文件的语言子文件夹。

using (var engine = new TesseractEngine(@"./tessdata", "deu", EngineMode.Default))

如果 deu 文件不直接位于 tessdata 文件夹中,则不起作用 - 使用@"./tessdata/deu"时也不起作用。

仅当语言文件直接位于 tessdata 文件夹(也在项目结构中)时才有效。

如何正确使用所有可用的语言?

²实际上,如果以后可能的话,我想自动检测图像中的语言 - 例如,通过使用每种语言扫描每个图像并检查哪种语言的效果最好。 如果您对如何做到这一点有任何想法,请告诉我。

您应该在项目的调试文件夹中创建一个tessdata目录并将语言文件放在那里。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM