簡體   English   中英

如何從我當前在機器上的瀏覽器中打開的網頁中獲取文本/html?

[英]How can I get text/html from a web page I currently have open in a browser on my machine?

我想做這樣的事情:

from lxml import html
import requests

page = requests.get('https://a-website.com/')

但是,我不想傳遞定義的硬編碼 url,而是想獲取當前在 Web 瀏覽器中打開的頁面。 page = requests.get(whateverisopeninmychrome) 對於它的價值,它是我專門尋找的 div 的文本內容。

有什么辦法可以做到這一點,或者甚至有可能嗎? 我找不到有關從您計算機上當前打開的瀏覽器中提取 html/內容的任何其他信息。

不,你不能喜歡這個。 一種方法是在Google ChromeFirefox上打開開發者控制台,同時打開您的網站並使用如下 javascript 語法:

要按 className搜索,它將返回一個列表,您必須獲得一個元素:

var html = document.getElementsByClassName('htmlClassHere')[0].innerText

對於按id搜索,它將返回元素,您可以像這樣使用它:

var html = document.getElementsById('htmlIdHere').innerText

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM