繁体 English 中英

如何将图像中的 base64 数据解码为文本？

[英]How to decode base64 data in an image to text?

原文 2021-12-28 01:04:27 2 1 python/ ocr

我今天被问到这个奇怪的问题，我无法给出直接的答案。

我有一张描绘 base64 文本的图像。 如何将其转换为文本？

我通过 pytesseract 尝试了这个，但在 tesseract 中是一个使文本乱码的语言组件。 所以我认为这不是 go 的方法。 我试着研究了一下，但似乎这不是一个相当普遍的问题（至少可以这么说）。 我不知道它有什么用，但肯定很烦人！

我还可以尝试哪些其他事情？

多么有趣的问题。 然而，这个任务并不是非常不规则的，因为我以前见过人们从图像中提取大量混乱的单词。 提取一长串杂乱无章的 base64 文本可能更具挑战性。 我见过的一些 OCR 工具是：

OpenCV 的 opencv-python 包装器

Tesseract 的 pytesseract 包装器（如您所述）

除了两个流行的之外，我发现了更多的 OCR 包装器： https://pythonrepo.com/repo/kba-awesome-ocr-python-computer-vision

为了使这些工作，图像还需要相当好的质量。 如果 base64 图像是可预测的并且采用结构化形式，您可以创建自己的参考图像并将它们与原始图像进行比较以确定字符串中的每个字符并完全绕过 OCR 的需要。

OCR 显然存在局限性，例如图像需要缩放、对比度和 alignment，任何小错误都可能破坏 base64 文本。 我显然以前从未见过 OCR 用于这样的事情，所以我不确定 go 从哪里过去，但我很肯定你在正确的轨道上！

[英]How to decode a Base64 data string to print text in Python to achieve image to text

[英]How to Decode base64 Image URIs

[英]How to decode text with base64 in Python

[英]Python Decode Base64 qUncompress Image

[英]Decode base64 image in JSON with Python

[英]Not able to decode base64 encoded image

[英]How do you decode Base64 data in Python?

[英]Decode base64 data as array in Python

[英]How to decode base64 to GIF in python?

[英]How to decode base64 in python3

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在Python中解码Base64数据字符串以打印文本以实现图像到文本如何解码 base64 图像 URI 如何在 Python 中使用 base64 解码文本 Python解码Base64 q解压缩图像使用 Python 解码 JSON 中的 base64 图像无法解码 base64 编码图像如何在 Python 中解码 Base64 数据？在Python中将base64数据解码为数组如何在python中将base64解码为GIF？如何在python3中解码base64

相关标签