繁体   English   中英

在Python中使用urllib2

[英]Using urllib2 in Python

我正在尝试通过python执行以下操作:

从此网站上: http : //www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt- BR& status=ativo

我想选中第四个复选框,然后单击“下载图像”。

那就是我所做的:

import urllib2
import urllib
url = "http://www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt-BR&status=ativo"
payload = {"chkArquivoDownload3_ativo":"1"}
data = urllib.urlencode(payload)
request = urllib2.Request(url, data)

print request

response = urllib2.urlopen(request)
contents = response.read()

print contents

有没有人有什么建议?

Selenium是一个很棒的项目,它使您可以使用python控制Firefox浏览器。 像这样:

from selenium import webdriver

browser = webdriver.Firefox()

browser.get('http://www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt-BR&status=ativo')

browser.find_element_by_id('chkArquivoDownload3').click()
browser.find_element_by_id('imgSubmeter_ativo').click()

browser.quit()

可能会工作。

Web浏览器是相互作用的复杂组件集合。 Python没有内置的网络浏览器(特别是DOM或Javascript引擎),它只是下载一个html文件,该文件通常会在您的浏览器中与所述DOM和javascript交互。

我预见的最简单的方法是:

  1. 使用python模块BeautifulSoup解析字符串。
  2. 使用您已解析的信息手动进行下载请求。
  3. 将下载的图像保存到文件

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM