簡體   English   中英

在Python中使用urllib2

[英]Using urllib2 in Python

我正在嘗試通過python執行以下操作:

從此網站上: http : //www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt- BR& status=ativo

我想選中第四個復選框,然后單擊“下載圖像”。

那就是我所做的:

import urllib2
import urllib
url = "http://www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt-BR&status=ativo"
payload = {"chkArquivoDownload3_ativo":"1"}
data = urllib.urlencode(payload)
request = urllib2.Request(url, data)

print request

response = urllib2.urlopen(request)
contents = response.read()

print contents

有沒有人有什么建議?

Selenium是一個很棒的項目,它使您可以使用python控制Firefox瀏覽器。 像這樣:

from selenium import webdriver

browser = webdriver.Firefox()

browser.get('http://www.bmf.com.br/arquivos1/arquivos_ipn.asp?idioma=pt-BR&status=ativo')

browser.find_element_by_id('chkArquivoDownload3').click()
browser.find_element_by_id('imgSubmeter_ativo').click()

browser.quit()

可能會工作。

Web瀏覽器是相互作用的復雜組件集合。 Python沒有內置的網絡瀏覽器(特別是DOM或Javascript引擎),它只是下載一個html文件,該文件通常會在您的瀏覽器中與所述DOM和javascript交互。

我預見的最簡單的方法是:

  1. 使用python模塊BeautifulSoup解析字符串。
  2. 使用您已解析的信息手動進行下載請求。
  3. 將下載的圖像保存到文件

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM