繁体   English   中英

从Point链接提取PDF文本

[英]PDF Text extraction from Point links

我在获取链接链接时遇到问题,例如,如果我在pdf中有一个链接重定向到另一个链接。 我需要解析两个链接,并在第二个链接命中的最后一点获取文本

我尝试了pyMUPDF软件包,并且能够访问特定页面中的所有链接。 我能够获取特定页面的文本。 但我无法获得链接和最终文本的链接

我在页面对象上尝试了page.getLinks() ,它仅给我该页面上的链接,但没有链接

link=page.getLinks()
for i in link:
    print(doc._getXrefString(i['xref'], compressed=False))

上面的代码给了我/ Rect值,但是没有文本

如果有一个链接指向另一个链接,而第二个链接指向文本,则需要最后一个文本

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM