[英]How to extract date from multiple transaction receipts in python having no pattern
我有多个交易收据,我试图从这些收据中提取发票金额。 问题是我使用的ocr
无法从文档中捕获某些金额。 我使用枕头和pytesseract
和pdf2image
将pdf
文档转换为图像,然后使用ocr
从这些图像中提取数据。 然后我将文本转换为ocr
html
文件,以使用关键字和位置提取数据。 但是,某些信息尚未从pdf
提取。 请帮我解决这个问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.