繁体 English 中英

如何在Tesseract框文件中获取或产生所需的Unicode？

[英]How do I get or produce the Unicode needed in Tesseract box file?

原文 2015-03-14 13:53:18 1 1 linux/ unicode/ ocr/ tesseract

在https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3此处的tesseract的google文档中，有一条指令要求我必须获取Box文件中生成的字符的Unicode。

s 734494751751519 0

p 753486776776518 0

r 779494796796518 0

i 799 494 810 527 0

n 814494837837 0

g 839 485 862 518 0

t 865492878521 0

u 101453122484 0

b 126453146486 0

e 149452168477 0

r 172453187476 0

d 211 451 232 484 0

e 236451255255475 0

n 259452281475 0

现在，我的问题是在哪里或如何获得？ 我正在为孟加拉语言开发OCR。

1 个解决方案

框文件是UTF-8编码的文本文件。 您可以使用Unicode兼容的文本编辑器或Box文件编辑器，使用喜欢的Bangla输入法打开和编辑字符。

如何从文本文件生成制表符分隔的文件？

[英]How do I produce a tab separated file from a text file?

如何在 bash 脚本中检查 tesseract 的 output？

[英]How do I check for output of tesseract in bash script?

这个小黑匣子是什么，我如何摆脱它？

[英]What is this little black box and how do I get rid of it?

如何在eclipse中输入unicode字符？

[英]How do I enter unicode characters in eclipse?

如何在Linux中创建Unicode文件名？

[英]How do i create a unicode filename in linux?

如何在Linux中使用POSIX方法从文件中读取Unicode-16字符串？

[英]How do I read Unicode-16 strings from a file using POSIX methods in Linux?

如何在 linux 和其他测试上生成文件 i/o 缓冲区？

[英]How to produce file i/o buffer on linux and other test?

如何获得 Alpine linux 的 tesseract 常规英语语言 package？

[英]How can I get tesseract regular english language package for Alpine linux?

如何将文件上传到无所事事的ubuntu虚拟盒中？

[英]How do I get files onto my vagrant ubuntu virtual box?

我如何获得最近一个小时左右在Linux机器上运行的进程的列表？

[英]How do I get a list of process that have run on my linux box during the last hour or so?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何从文本文件生成制表符分隔的文件？如何在 bash 脚本中检查 tesseract 的 output？这个小黑匣子是什么，我如何摆脱它？如何在eclipse中输入unicode字符？如何在Linux中创建Unicode文件名？如何在Linux中使用POSIX方法从文件中读取Unicode-16字符串？如何在 linux 和其他测试上生成文件 i/o 缓冲区？如何获得 Alpine linux 的 tesseract 常规英语语言 package？如何将文件上传到无所事事的ubuntu虚拟盒中？我如何获得最近一个小时左右在Linux机器上运行的进程的列表？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM