[英]Detect and analyze text using Amazon Textract from a multi page document PDF synchronously
回答https://stackoverflow.com/a/62174368/8117673
進一步的問題是 - 它會影響 Amazon Textract文本檢測的准確性嗎?
我是否需要對圖像進行預處理才能從 Amazon Textract 獲得更好的結果?
我使用命令pdftoppm將 PDF 轉換為 PNG。 在 Python -> subprocess.Popen(['pdftoppm -png Sample.pdf Sample'])
Amazon Textract 對 PDF 文件的准確性超過了 PNG 格式。 因為 PDF 是原始文件。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.