[英]PDF Text extraction from Point links
我在获取链接链接时遇到问题,例如,如果我在pdf中有一个链接重定向到另一个链接。 我需要解析两个链接,并在第二个链接命中的最后一点获取文本
我尝试了pyMUPDF软件包,并且能够访问特定页面中的所有链接。 我能够获取特定页面的文本。 但我无法获得链接和最终文本的链接
我在页面对象上尝试了page.getLinks()
,它仅给我该页面上的链接,但没有链接
和
link=page.getLinks()
for i in link:
print(doc._getXrefString(i['xref'], compressed=False))
上面的代码给了我/ Rect值,但是没有文本
如果有一个链接指向另一个链接,而第二个链接指向文本,则需要最后一个文本
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.