繁体   English   中英

如何使用PDFrw在Python中从PDF中提取数据

[英]How To Extract Data From PDF In Python Using PDFrw

我正在尝试使用PDFrw从某个PDF获取数据(让我们说这里的页面右上角的那个)。 我使用PDFrw来做到这一点。 我查看了他们提供的文档(我找不到太多)并查看了他们在git上发布的示例代码,但我似乎无法获得足够的信息来做我想做的事情。 如何使用PDFrw制作一个简单的程序进入PDF(或者如果有更好的那个,则进入另一个程序)并提取某段文本。 我正在考虑将其转换为HTML ...这会更容易吗? 看看我上面提供的PDF作为一个例子,我想得到(让我们说)电压,这在PDF中是600瓦...我怎样才能以最简单的方式做到这一点? 我找不到任何关于此的任何其他堆栈溢出问题,所以希望有人可以帮助以前使用它!

谢谢!

我是pdfrw的作者,它并不是真的为此而设计的。 你应该看看pdfminer。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM