繁体   English   中英

将扫描的PDF表格转换为Excel

[英]Convert a scanned PDF table to Excel

我有一个扫描的PDF,其中包含一些表格格式的随机数据,并希望将其复制到Excel工作表中。

我玩过数字PDF并使用'tabula'来提取表格,但扫描的PDF需要OCR(我在google上看到的)。 我知道有一个涉及OCR(tesseract),但不知道我应该采取什么方法来解决问题。

看看Tesseract的TSV(制表符分隔值)输出格式,看看Excel是否可以读取或导入它。 可能需要进行一些转换才能将其转换为Excel可以使用的格式。

https://digi.bib.uni-mannheim.de/tesseract/manuals/tesseract.1.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM