我目前正在开展一个项目,我的目标是在图像中找到文本。 OCR的文本不是我的意图。 我想基本上获取图像中文本的边界。 我正在使用AForge.Net成像组件进行操作。 在某种意义上的任何帮助?

更新2/5/09:我已经在我的项目中沿着另一条路线前进了。 但是我确实尝试使用MODI(Microsoft Office Document Imaging)获取文本。 它允许您轻松地OCR图像并从中提取文本。

===============>>#1 票数:13 已采纳

这是一个活跃的研究领域。 关于这个问题,有很多关于学术论文的文章。 给你提供帮助尤其是没有更多的deatails是很困难的。 您在寻找特定类型的文字吗? 字体? 仅限英语? 你熟悉学术文献吗?

“文本检测”是任何OCR(光学字符识别)系统中的标准问题,因此在互联网上有许多代码来处理它。

我可以从谷歌开始列出成堆的链接,但我建议你只是搜索“文本检测”并开始阅读:)。 还有充足的示例代码。

===============>>#2 票数:3

识别图像中的文本确实是该领域研究人员的一个热门话题,但只有当验证成为防御垃圾邮件机器人的“常态”时才开始失控。 为什么要使用captcha作为保护? 好吧,因为在图像中定位(和读取)文本非常困难!

我提到验证码的原因是因为最大的进步*是在这个小区域内进行的,我认为你的解决方案最好在那里找到。 特别是因为验证码确实是在杂乱的图像中定位文本(或类似文本的东西),然后尝试正确读取字母。

所以,如果你能找到一个好的开源验证码破解工具,你可能拥有继续你的任务所需的一切......
你甚至可以丢弃处理字符识别本身最困难的代码,因为那些OCR用于读取扭曲的文本,这是你不必做的事情。

*:为“非研究人员”提供可见,可用和实用信息方面的进展

===============>>#3 票数:0

笔画宽度变换可以为您做到这一点。 这至少是MS为他们的手机操作系统开发的。 有关实施的讨论,请访问https://stackoverflow.com/

===============>>#4 票数:0

如果您可以使用在线API,那么http://www.wisetrend.com/wisetrend_ocr_cloud.shtml上的API除了OCR之外还可以进行文本检测。

  ask by Pat translate from so

未解决问题?本站智能推荐: