简体   繁体   English

Java:Tesseract-ocr:如何找到单词坐标?

[英]Java: Tesseract-ocr: How to find word co-ordinates?

Recently i have success using Tesseract-ocr in converting PNG file into Text. 最近,我成功使用Tesseract-ocr将PNG文件转换为文本。 I am Using Java. 我正在使用Java。

Scenario: I am taking screenshot(PNG) of the Mobile app and using Tesseract for converting PNG file into Text. 场景:我正在获取移动应用的屏幕快照(PNG),并使用Tesseract将PNG文件转换为文本。

Question: When i convert PNG file into Text, can i also get coordinates(X,Y) of the certain text element on the mobile screen? 问题:当我将PNG文件转换为文本时,我还能在移动屏幕上获取特定文本元素的坐标(X,Y)吗?

Example: Upon Conversion of PNG file into Text, text shows like this "Help people interested in this repository understand your project by adding a README." 示例:将PNG文件转换为文本后,文本显示为“通过添加自述文件来帮助对此存储库感兴趣的人了解您的项目”。

In the above Example can i get coordinate(X,Y) of the Text element "understand" ? 在上面的示例中,我可以获取Text元素“了解”的坐标(X,Y)吗?

This is my Project in git: 这是我在git中的项目:

https://github.com/rkandanuru/Tess4J.git https://github.com/rkandanuru/Tess4J.git

Regards, Rakesh 问候,瑞克什

不确定在移动平台上运行的Tess4J,但是有几个在其单元测试中获取单词坐标的示例。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM