![](/img/trans.png)
[英]Using Selenium with Python in Chrome to click “download” button and download PDF
[英]Access the Download button in PDF using Selenium, Python
我正在尝试使用适用于Chrome的Selenium Webdriver下载PDF( http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215 )。
“下载”按钮显示在页面顶部的动态功能区中,当其悬停时会显示。
鼠标悬停在PDF上时,带状PDF就是这样。
我打算通过我的Python脚本单击此下载按钮(“打印”符号旁边的向下箭头符号)。
先感谢您。
您不需要硒即可下载。 您可以使用urllib2
import urllib2
def download_file(pdf_url):
response = urllib2.urlopen(pdf_url)
file = open("doc.pdf", 'w')
file.write(response.read())
file.close()
def main():
download_file("http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215")
if __name__ == "__main__":
main()
PDF基本上是在浏览器的内置扩展程序中打开的,您可以通过该扩展程序查看PDF文件。 Selenium基本上无法访问它的HTML,因为HTML驻留在扩展名中。
您可以使用requests
库下载简单的PDF。
import requests
url = "http://judis.nic.in/supremecourt/imgs1.aspx?filename=43215"
r = requests.get(url, stream=True)
with open("THE.pdf", "wb") as fd:
for ch in r.iter_content():
fd.write(ch)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.