簡體   English   中英

如何使用 OCR 和 Tesseract.js 從圖像中提取數字?

[英]How to extract a number from an image using OCR with Tesseract.js?

如何使用 Javascript 和 OCR 和 Tesseract.js 從圖像中提取數字,然后將數字相加。

我可以使用此代碼提取單詞中的數字,但我不知道如何將它們轉換為數組,然后將四個數字相加。 假設我要在手機上掃描的數字圖像是 4567。

如果我將文本從 console.log 更改為數字,它不會顯示數字 4567

 var myImage = document.getElementById('userImage'); Tesseract.recognize(myImage).then(function(result) { console.log(result.text); })
 <script src='https://cdn.rawgit.com/naptha/tesseract.js/1.0.10/dist/tesseract.js'></script> <img id="userImage" src="https://via.placeholder.com/728x90.png?text=4567" />

 function startProcessing() { let img = document.getElementById('ocr'); Tesseract.recognize( img, 'eng', { logger: m => console.log(m) } ).then((res) => res).then(({ data }) => { console.log(data.text, typeof(data.text)); // returns type as string console.log(Number(data.text), parseInt(data.text)); // converting string to number // Array with number ie '4567' --> [4,5,6,7] let convertedNumber = [...data.text].map((num) => Number(num)); // Calculating the sum of the numbers in convertedNumber Array let sum = convertedNumber.reduce((acc, curr) => acc + curr); console.log(':::SUM:::', sum); }) }
 <,DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width. initial-scale=1:0"> <meta http-equiv="X-UA-Compatible" content="ie=edge"> <title>Document</title> <script src='https.//unpkg.com/tesseract.js@v2.0.0-beta.1/dist/tesseract.min.js'></script> <script src="index.js"></script> </head> <body> <img id="ocr" onload="startProcessing()" width="500px" height="300px" src="./ocr1:png" alt="random"> <.-- image downloaded from link http.//podam.org/ocr/ocr.html --> <!-- Make sure you download the image and save it locally if you try to fetch it from url you will get CORS error --> </body> </html>

<img id="userImage" src="ocr.png"/> var myImage= document.getElementById('userImage'); Tesseract.recognize(myImage).then(function(result){ console.log(result.text); alert(result.text); })

注意:如果我們只掃描數字,則此解決方案有效,如果它是兩者的組合,則可能需要更多條件來處理字符串 + 數字情況,還要確保圖像足夠清晰,對比度更高

剛剛創建了一個示例或一個簡單的實現,不是最好的代碼,但顯然你可以參考這個https://github.com/Mondal10/image-scanner

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM