標簽[ocr] - 堆棧內存溢出

[英]OCR PDF image to Excel by template

我需要將大量質量差的 PDF 表數據掃描轉換為 excel 表。我看到解決方案的唯一方法是在預生成的圖像上訓練 tesseract 或其他一些框架（在大多數情況下，PDF 中的所有表都是相同的）。在家庭條件下有大約 70-80% 的出色解決方案是真的嗎？您可以提供什么建議。除了 Abby F ...

使用 Document AI 檢測 map 個鍵值對

[英]Detecting a map of key value pairs using Document AI

我從 DocumentAI 文檔中了解到，從醫學測試結果等報告中提取信息的最佳匹配是使用表單解析處理器。這對於一個 label 恰好有一個值的報告非常有用。比如患者姓名或患者年齡等。但我試圖在 map 的鍵值對中獲取各種測試結果表，其中鍵是測試名稱並重視我們的結果。對於自定義處理器，我嘗試選擇一 ...

如何處理 Google Document AI OCR Api 的 JSON 響應到正確的結構？

[英]How to Process JSON response of Google Document AI OCR Api to proper structure?

我想從 Google 文檔 ai ocr 響應中掃描的 pdf 文件中制作出正確的結構化 txt 文件，但我從文檔中得到了 json 響應。一個 OCR 響應，其中包含一個字符串中的所有文件文本和 pdf 文件圖像的 X、Y 坐標以及該字符串的塊或標記的索引。我無法 map 收到坐標上的文本來 ...

改進從圖像中讀取文本

[英]Improve text reading from image

我正在嘗試從電影中讀取電影演職員表。為了制作 MVP，我從一張圖片開始：我使用這段代碼：我嘗試了不同的 psm，但它返回了一個難看的文本。我嘗試使用其他分辨率更高且效果更好的圖片，但我能夠啟用非高清電影。我可以做些什么來提高讀數的精度？問候昆汀 ...

將字形的 SVG 路徑轉換為字形表示的字符

[英]Convert SVG path of a glyph to the character the glyph represents

這個有效的 CodePen 演示顯示了一個表示為向量的數字。請問demo中的數字向量（SVG格式）如何轉換為實數？從我在 web 上的搜索，Tesseract 不讀取矢量圖形 (SVG)，任何人都可以展示一些如何讀取數字矢量的演示或示例嗎？例如，下面的矢量圖形代碼在 console.log 中 ...

發生異常：PermissionError

[英]Exception has occurred: PermissionError

我正在嘗試用 python 制作一個程序，它將能夠使用 OCR 分析一些游戲事件的統計數據，並對玩家/團隊的表現進行總結。我真的是 Python 的新手，之前我安裝了多個 Python (2 - 3)，因為幾年前我就嘗試過。所以我卸載了所有東西並重新安裝了最新的 Python 3 到默認/推薦 ...

OCR 圖像預處理 (pytesseract)

[英]Image Pre-processing for OCR (pytesseract)

我正在嘗試使用 pytesseract 對圖像進行 OCR。一旦我對下圖進行 OCR，結果顯示為“WV over” 有哪些圖像預處理技術可用於通過填充文本的缺失部分來增強此圖像。通過以下方式增強圖像 OCR 能力，填充圖像中缺失的文本部分提高圖像質量請讓我知道可用於滿足上述要求的示例代碼。 ...

如何用視覺檢測垂直堆疊的文字 API

[英]How to detect vertically stacked text with vision API

Basic text detection API (eg google) 對於下圖沒有返回任何信息。要嘗試 Google 的願景 API，將圖像保存在本地並運行：它可能會返回亂碼。我們想要的文本是 RAW9405。是否有任何現有模型或是否需要培訓？ ...

圖片轉文字OCR Web 圖片 URL 上傳

[英]Image to Text OCR Web Image URL Upload

參考此處的工作代碼筆演示，如果單擊選擇文件按鈕從本地計算機上傳圖像並提取圖像中的文本，則該應用程序工作正常。但是，如何上傳Web 圖像 URL這樣的圖像，而不是從本地計算機文件上傳，並借助我在演示中標記為 output OCR 文本結果的按鈕？我將不勝感激我能得到的任何幫助:) <div ...

使用 OpenCV 從圖像中去除噪聲

[英]Remove noise from image using OpenCV

我有這些圖片在此處輸入圖像描述在此處輸入圖像描述我想從這些圖像中去除噪音，以便我可以使用 pytesseract 將它們轉換為文本。噪點只有藍色，所以我試圖從圖像中去除藍色。還是沒有好結果。結果是在此處輸入圖像描述 OCR 結果為 FL1S4y。 ...

Gosseract 未運行

[英]Gosseract not run

# github.com/otiai10/gosseract/v2 tessbridge.cpp:5:10: 致命錯誤：leptonica/allheaders.h: 沒有這樣的文件或目錄 5 | #include <leptonica/allheaders.h> | ^~~~~~ ...

比較 Node.js 中的兩個 RegEx 對象

[英]Comparing two RegEx objects in Node.js

我正在使用 NodeRED 對從 Microsoft Azure 認知服務上的圖像分析 (OCR) 創建的字符串執行一些邏輯。圖像分析不允許任何模式匹配/輸入模式。生成的字符串（我們稱它為“A”）有時會略微錯誤地解釋字符，典型的是“l”=“1”或“s”=“5”。生成的字符串可以是僅有的幾種不同 ...

如何檢查列表中的任何字符串是否出現在字符串中，然后在文本框中顯示匹配的任何內容？

[英]How to check if any strings in a list appears in a string, and then display anything that matches in a text box?

我正在創建一個 OCR 應用程序，它可以檢測實時鏡頭中的任何文本，並將該文本顯示在文本框中。但是，我想過濾此文本以僅顯示存儲在列表中的某些單詞。這是我目前擁有的顯示找到的任何文本的代碼這是我嘗試使用的，但我沒有得到 output 有誰知道如何讓文本視圖只顯示列表中的文本？這是我的清單我嘗 ...

如何僅從 Azure 表單識別器 API 獲取自定義字段名稱？

[英]How to GET only custom Field Names from Azure Form Recognizer API?

我訓練了一個自定義表單識別器 Model。它測試得很好。但是我找不到要調用的 API 端點，它只返回我發送給 model 進行分析的表單的鍵/值對。示例：我訓練了一個自定義 model 來僅查找First name和Last name 當我將 PDF 發布到端點時： https://{my- ...

有沒有辦法解析簽名 PDF 的表單字段，例如使用 Python 或 Java 並將它們寫入 CSV？

[英]Is there a way to parse the form fields of signed PDFs e.g. using Python or Java and write them to a CSV?

我想從簽名的 PDF 中解析表單字段。我的意思是例如復選框。我已經嘗試過不同的方式（使用 Python），例如 PyPDF2、pikepdf 甚至 pdfminer，但是我只取出字母而不是表單字段。如果有人知道如何從簽名的 PDF 中解析表單字段，那將是我的救星。我可以解析單個字母，但不能 ...

使用 OCR 讀取圖像上的數字 python

[英]Read numbers on image using OCR python

我正在嘗試在 Python 和 tesseract 中使用 OpenCV 提取圖像上的數字。這是我的嘗試，但我什么也沒得到。該代碼未返回預期的數字這是圖像示例該代碼不返回任何數字。我怎樣才能提高這種圖像的質量才能提取數字？ ...

如何從 Easyocr 結果創建自動打折價目表？

[英]How to create a automatic discounted price list from Easyocr result?

因此，我們的任務是創建一個代碼，將 Easyocr 的結果放入表格（特別是食物菜單）中。磚牆在從 easyocr 獲得結果后立即開始，因為我嘗試對結果進行排序，但它按字符和數字而不是單詞和價格排序。我知道手動創建一個列表可以解決這個問題，但它超過了自動化在 ocr 上應用折扣的代碼的目的。我 ...

如何在 tesseract 中獲取字符明智的置信度值 - c#

[英]How to get character wise confidence values in tesseract - c#

我正在構建一個應用程序來對圖像進行 OCR。我一切正常，但我無法獲得單詞中每個字符的置信度值。我可以獲得單詞的置信度值。這是我試圖為每個角色獲得信心的代碼：using (ResultIterator iter = doocr.GetIter()) { iter.Begin(); do ...

如何在 python 文件中運行 midee doctr？

[英]How to run midee doctr in python file?

當我嘗試使用 python 文件運行以下代碼時：收到此錯誤：- 我將如何運行 in.py 文件 ...

為 Tesseract_OCR 准備圖像

[英]making image ready for Tesseract_OCR

我是計算機視覺領域的新手。我試圖讓我的圖像很容易被 OCR 識別。我已經做了很多步驟來讓 Tesseract_OCR 更容易識別，但都是徒勞的。請有人幫助我。這是我的原始圖像input.jpg 對不起，我不擅長這個，但任何幫助將不勝感激謝謝那是代碼這是我的 output 圖片，但它仍然沒有 ...