簡體   English   中英

在 python 中使用 selenium 抓取 HTML 代碼部分(不是文本)

[英]Scraping the portion of HTML code (not text) using selenium in python

我想使用 Selenium 從一個完整的網頁中抓取一部分 HTML 代碼(不是全部),以便在我當前的項目中使用。 我不想要 HTML 的內部文本,而是實際代碼並將其存儲在外部文本文件或新的 HTML 文件中。

限制:我不能使用任何其他庫,因為該網站是動態的並且富含 JS,只有 Selenium 可以工作。

不,可以用硒提取選定的 html。 要么您可以提取完整的 html,要么您必須一個一個地提取每個元素:

使用outerHTML提取整個標題標簽(包括標題):

elem = driver.find_element_by_class_name("header cf")
source_code = elem.get_attribute("outerHTML")

提取導航中的所有內容(包括導航):

elem = driver.find_element_by_class_name("nav")
source_code = elem.get_attribute("outerHTML")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM