繁体   English   中英

使用Selenium,Python访问PDF中的“下载”按钮

[英]Access the Download button in PDF using Selenium, Python

我正在尝试使用适用于Chrome的Selenium Webdriver下载PDF( http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215 )。

“下载”按钮显示在页面顶部的动态功能区中,当其悬停时会显示。

鼠标悬停在PDF上时,带状PDF就是这样。

没有悬停功能区的PDF

我打算通过我的Python脚本单击此下载按钮(“打印”符号旁边的向下箭头符号)。

先感谢您。

您不需要硒即可下载。 您可以使用urllib2

import urllib2

def download_file(pdf_url):
    response = urllib2.urlopen(pdf_url)
    file = open("doc.pdf", 'w')
    file.write(response.read())
    file.close()

def main():
    download_file("http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215")

if __name__ == "__main__":
    main()

PDF基本上是在浏览器的内置扩展程序中打开的,您可以通过该扩展程序查看PDF文件。 Selenium基本上无法访问它的HTML,因为HTML驻留在扩展名中。

您可以使用requests库下载简单的PDF。

import requests

url = "http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215"
r = requests.get(url, stream=True)

with open("THE.pdf", "wb") as fd:
    for ch in r.iter_content():
        fd.write(ch)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM