簡體   English   中英

我如何在Python中從selenium.webdriver獲取HTML?

[英]How can i get html from selenium.webdriver in Python?

謝謝您的關注,對不起,我的英語不好。

我在http://flvxz.com/上獲取html,當我在輸入框中輸入一些單詞並單擊click.it時,它就像:

  • 加載Yahoo主頁
  • 搜索“某物”(輸入某詞並單擊按鈕)
  • 得到返回的HTML

我的網站通過javaScrip返回消息

這是我的代碼

browser = webdriver.Firefox()

browser.get('http://flvxz.com/')

input_box = browser.find_element_by_id("videoPageURI")  # Find the search box
button = browser.find_element_by_id("fetchButton")  # find the button

input_box.send_keys(url)  # input some string
button.click()  # click

然后,我如何獲得新的HTML? 我嘗試如下,不工作。

html = browser.find_element_by_tag_name('html').text();

我的問題:

  1. 我如何獲取HTML?
  2. 有沒有更好的方法或工具來執行此jop(我不喜歡它打開窗口,但我喜歡它控制瀏覽器的方式)?

非常感謝,我正在提高我的英語水平。

要點1.如何獲取html代碼:

首先,您可能需要等待頁面完全加載完畢(請參閱本文

然后,您需要做的就是訪問page_source屬性:

html = browser.page_source

點2。是否有更好的方法可以做到這一點:

據我所知,這是使用硒的正確方法。 還有其他方法可以在頁面中找到所需的元素,但是在性能方面不會有太大變化。

如果您不需要查看實際顯示的頁面,建議您使用無頭瀏覽器(例如PhantomJS)而不是Firefox

driver=webdriver.PhantomJS('your pahtomjs exe file location')

有關更多信息,請參見此SO QA ,以及有關如何使用python設置PhantomJS的本教程

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM