簡體   English   中英

如何從圖像生成tiff / box文件以在Windows中訓練Tesseract

[英]How to generate a tiff/box file from an image to train Tesseract in Windows

我正在嘗試在Windows中訓練Tesseract,為此我需要一對tiff / box文件,我正在嘗試使用jTessBoxEditor創建它,但它不接受圖像作為輸入。 我也嘗試過boxFactory,但它運行不正常。 有誰知道從圖像創建配對的最佳工具是什么?

謝謝

如果你有jTessBoxEditor,那么你有Tesseract bin文件。 轉到jTessBoxEditor的tesseract-ocr子文件夾並運行以下命令:

tesseract.exe D:\\ testocr \\ TestImage.tif D:\\ testocr \\ TestImage batch.nochop makebox

它應該生成文件D:\\ testocr \\ TestImage.box 然后在jTessBoxEditor中,轉到Box Editor選項卡並打開圖像。 盒子文件會自動加載,您可以檢查一切是否正常並糾正可能的錯誤。

由於無法使用jTessBoxEditor正確打開圖像以便使用它們的盒子,我遇到了同樣的問題。 我意識到一個基本組件是.tif圖像的名稱和.box文件的名稱必須相同,除了不同的擴展名。 如果沒有這個,jTessBoxEditor將無法知道哪個盒子文件與哪個圖像一起使用。 因此,使用上面的darkpotpot建議的語法,然后確保兩個文件名匹配所示,然后單擊jTessBoxEditor的Box Editor選項卡中的“打開”按鈕應該可以工作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM