cost 154 ms
OCR PDF图片到Excel模板

[英]OCR PDF image to Excel by template

我需要将大量质量差的 PDF 表数据扫描转换为 excel 表。 我看到解决方案的唯一方法是在预生成的图像上训练 tesseract 或其他一些框架(在大多数情况下,PDF 中的所有表都是相同的)。 在家庭条件下有大约 70-80% 的出色解决方案是真的吗?您可以提供什么建议。 除了 Abby F ...

使用 Document AI 检测 map 个键值对

[英]Detecting a map of key value pairs using Document AI

我从 DocumentAI 文档中了解到,从医学测试结果等报告中提取信息的最佳匹配是使用表单解析处理器。 这对于一个 label 恰好有一个值的报告非常有用。比如患者姓名或患者年龄等。但我试图在 map 的键值对中获取各种测试结果表,其中键是测试名称并重视我们的结果。 对于自定义处理器,我尝试选择一 ...

如何处理 Google Document AI OCR Api 的 JSON 响应到正确的结构?

[英]How to Process JSON response of Google Document AI OCR Api to proper structure?

我想从 Google 文档 ai ocr 响应中扫描的 pdf 文件中制作出正确的结构化 txt 文件,但我从文档中得到了 json 响应。 一个 OCR 响应,其中包含一个字符串中的所有文件文本和 pdf 文件图像的 X、Y 坐标以及该字符串的块或标记的索引。 我无法 map 收到坐标上的文本来 ...

改进从图像中读取文本

[英]Improve text reading from image

我正在尝试从电影中读取电影演职员表。 为了制作 MVP,我从一张图片开始: 我使用这段代码: 我尝试了不同的 psm,但它返回了一个难看的文本。 我尝试使用其他分辨率更高且效果更好的图片,但我能够启用非高清电影。 我可以做些什么来提高读数的精度? 问候昆汀 ...

将字形的 SVG 路径转换为字形表示的字符

[英]Convert SVG path of a glyph to the character the glyph represents

这个有效的 CodePen 演示显示了一个表示为向量的数字。 请问demo中的数字向量(SVG格式)如何转换为实数? 从我在 web 上的搜索,Tesseract 不读取矢量图形 (SVG),任何人都可以展示一些如何读取数字矢量的演示或示例吗? 例如,下面的矢量图形代码在 console.log 中 ...

发生异常:PermissionError

[英]Exception has occurred: PermissionError

我正在尝试用 python 制作一个程序,它将能够使用 OCR 分析一些游戏事件的统计数据,并对玩家/团队的表现进行总结。 我真的是 Python 的新手,之前我安装了多个 Python (2 - 3),因为几年前我就尝试过。 所以我卸载了所有东西并重新安装了最新的 Python 3 到默认/推荐 ...

OCR 图像预处理 (pytesseract)

[英]Image Pre-processing for OCR (pytesseract)

我正在尝试使用 pytesseract 对图像进行 OCR。 一旦我对下图进行 OCR,结果显示为“WV over” 有哪些图像预处理技术可用于通过填充文本的缺失部分来增强此图像。 通过以下方式增强图像 OCR 能力, 填充图像中缺失的文本部分提高图像质量请让我知道可用于满足上述要求的示例代码。 ...

如何用视觉检测垂直堆叠的文字 API

[英]How to detect vertically stacked text with vision API

Basic text detection API (eg google) 对于下图没有返回任何信息。 要尝试 Google 的愿景 API,将图像保存在本地并运行: 它可能会返回乱码。 我们想要的文本是 RAW9405。 是否有任何现有模型或是否需要培训? ...

图片转文字OCR Web 图片 URL 上传

[英]Image to Text OCR Web Image URL Upload

参考此处的工作代码笔演示,如果单击选择文件按钮从本地计算机上传图像并提取图像中的文本,则该应用程序工作正常。 但是,如何上传Web 图像 URL这样的图像,而不是从本地计算机文件上传,并借助我在演示中标记为 output OCR 文本结果的按钮? 我将不胜感激我能得到的任何帮助:) <div ...

使用 OpenCV 从图像中去除噪声

[英]Remove noise from image using OpenCV

我有这些图片在此处输入图像描述在此处输入图像描述我想从这些图像中去除噪音,以便我可以使用 pytesseract 将它们转换为文本。 噪点只有蓝色,所以我试图从图像中去除蓝色。 还是没有好结果。 结果是在此处输入图像描述 OCR 结果为 FL1S4y。 ...

Gosseract 未运行

[英]Gosseract not run

# github.com/otiai10/gosseract/v2 tessbridge.cpp:5:10: 致命错误:leptonica/allheaders.h: 没有这样的文件或目录 5 | #include <leptonica/allheaders.h> | ^~~~~~ ...

2023-01-25 10:28:53   1   26    go / ocr  
比较 Node.js 中的两个 RegEx 对象

[英]Comparing two RegEx objects in Node.js

我正在使用 NodeRED 对从 Microsoft Azure 认知服务上的图像分析 (OCR) 创建的字符串执行一些逻辑。 图像分析不允许任何模式匹配/输入模式。 生成的字符串(我们称它为“A”)有时会略微错误地解释字符,典型的是“l”=“1”或“s”=“5”。 生成的字符串可以是仅有的几种不同 ...

如何检查列表中的任何字符串是否出现在字符串中,然后在文本框中显示匹配的任何内容?

[英]How to check if any strings in a list appears in a string, and then display anything that matches in a text box?

我正在创建一个 OCR 应用程序,它可以检测实时镜头中的任何文本,并将该文本显示在文本框中。 但是,我想过滤此文本以仅显示存储在列表中的某些单词。 这是我目前拥有的显示找到的任何文本的代码 这是我尝试使用的,但我没有得到 output 有谁知道如何让文本视图只显示列表中的文本? 这是我的清单 我尝 ...

如何仅从 Azure 表单识别器 API 获取自定义字段名称?

[英]How to GET only custom Field Names from Azure Form Recognizer API?

我训练了一个自定义表单识别器 Model。它测试得很好。 但是我找不到要调用的 API 端点,它只返回我发送给 model 进行分析的表单的键/值对。 示例: 我训练了一个自定义 model 来仅查找First name和Last name 当我将 PDF 发布到端点时: https://{my- ...

有没有办法解析签名 PDF 的表单字段,例如使用 Python 或 Java 并将它们写入 CSV?

[英]Is there a way to parse the form fields of signed PDFs e.g. using Python or Java and write them to a CSV?

我想从签名的 PDF 中解析表单字段。 我的意思是例如复选框。 我已经尝试过不同的方式(使用 Python),例如 PyPDF2、pikepdf 甚至 pdfminer,但是我只取出字母而不是表单字段。 如果有人知道如何从签名的 PDF 中解析表单字段,那将是我的救星。 我可以解析单个字母,但不能 ...

使用 OCR 读取图像上的数字 python

[英]Read numbers on image using OCR python

我正在尝试在 Python 和 tesseract 中使用 OpenCV 提取图像上的数字。 这是我的尝试,但我什么也没得到。 该代码未返回预期的数字 这是图像示例 该代码不返回任何数字。 我怎样才能提高这种图像的质量才能提取数字? ...

如何从 Easyocr 结果创建自动打折价目表?

[英]How to create a automatic discounted price list from Easyocr result?

因此,我们的任务是创建一个代码,将 Easyocr 的结果放入表格(特别是食物菜单)中。 砖墙在从 easyocr 获得结果后立即开始,因为我尝试对结果进行排序,但它按字符和数字而不是单词和价格排序。 我知道手动创建一个列表可以解决这个问题,但它超过了自动化在 ocr 上应用折扣的代码的目的。 我 ...

如何在 tesseract 中获取字符明智的置信度值 - c#

[英]How to get character wise confidence values in tesseract - c#

我正在构建一个应用程序来对图像进行 OCR。 我一切正常,但我无法获得单词中每个字符的置信度值。 我可以获得单词的置信度值。 这是我试图为每个角色获得信心的代码:using (ResultIterator iter = doocr.GetIter()) { iter.Begin(); do ...

为 Tesseract_OCR 准备图像

[英]making image ready for Tesseract_OCR

我是计算机视觉领域的新手。 我试图让我的图像很容易被 OCR 识别。 我已经做了很多步骤来让 Tesseract_OCR 更容易识别,但都是徒劳的。 请有人帮助我。 这是我的原始图像input.jpg 对不起,我不擅长这个,但任何帮助将不胜感激谢谢那是代码 这是我的 output 图片,但它仍然没有 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM