![](/img/trans.png)
[英]hOCR output from OCRmyPDF
我正在運行 OCRmyPDF 從掃描的 PDF 創建可搜索的 PDF,它對我來說工作得很好。 我只想將掃描的 PDF 的每一頁的 hOCR output 保存在我的本地目錄中。 我怎樣才能做到這一點? ...
[英]hOCR output from OCRmyPDF
我正在運行 OCRmyPDF 從掃描的 PDF 創建可搜索的 PDF,它對我來說工作得很好。 我只想將掃描的 PDF 的每一頁的 hOCR output 保存在我的本地目錄中。 我怎樣才能做到這一點? ...
[英]ocrmypdf - could not find source-pdf?
我想使用 ocrmypdf 將一些 pdf 文件從圖片轉換為可讀的 pdf - 使用以下簡單代碼進行了嘗試:(invoice.pdf 當然可以在與 python 腳本相同的路徑中使用,並且應該生成 output.pdf) 但不幸的是,我收到此錯誤消息: 為什么他不能在執行 py 文件的同一文件夾中 ...
[英]How do I write a batch process command using gnu parallel?
我正在嘗試使用名為 ocrmypdf 的包進行一些批處理。 這是一個可以處理 1 個 pdf 文件的命令 ocrmypdf input.pdf output.pdf 這是一個可以處理我們運行目錄中所有pdf文件的命令。 parallel --tag -j 2 ocrmypdf '{}' 'ou ...
[英]Camelot Cannot extract entire table
我使用 Camelot 從 PDF 中提取表格信息,我使用 ocrmypdf(500dpi) 將其從掃描轉換為可搜索。 Camelot 似乎能夠識別表格並提取表格內的大部分數據,但似乎無法提取下半部分。 從本質上講,它看到了表格的上半部分,但似乎無法將文本與下半部分分開。 這是有問題的 PDF ...
[英]Import ocrmypdf in Visual Stdio Code in Python
我想導入ocrmypdf 。 我已經使用pip install --upgrade --user ocrmypdf安裝了軟件包 但是當我嘗試在 VSC 中導入時: 它捕獲了錯誤: ...