繁体   English   中英

如何将图像中的 base64 数据解码为文本?

[英]How to decode base64 data in an image to text?

我今天被问到这个奇怪的问题,我无法给出直接的答案。

我有一张描绘 base64 文本的图像。 如何将其转换为文本?

我通过 pytesseract 尝试了这个,但在 tesseract 中是一个使文本乱码的语言组件。 所以我认为这不是 go 的方法。 我试着研究了一下,但似乎这不是一个相当普遍的问题(至少可以这么说)。 我不知道它有什么用,但肯定很烦人!

我还可以尝试哪些其他事情?

多么有趣的问题。 然而,这个任务并不是非常不规则的,因为我以前见过人们从图像中提取大量混乱的单词。 提取一长串杂乱无章的 base64 文本可能更具挑战性。 我见过的一些 OCR 工具是:

OpenCV 的 opencv-python 包装器

Tesseract 的 pytesseract 包装器(如您所述)

除了两个流行的之外,我发现了更多的 OCR 包装器: https://pythonrepo.com/repo/kba-awesome-ocr-python-computer-vision

为了使这些工作,图像还需要相当好的质量。 如果 base64 图像是可预测的并且采用结构化形式,您可以创建自己的参考图像并将它们与原始图像进行比较以确定字符串中的每个字符并完全绕过 OCR 的需要。

OCR 显然存在局限性,例如图像需要缩放、对比度和 alignment,任何小错误都可能破坏 base64 文本。 我显然以前从未见过 OCR 用于这样的事情,所以我不确定 go 从哪里过去,但我很肯定你在正确的轨道上!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM