如何從我當前在機器上的瀏覽器中打開的網頁中獲取文本/html？

Question

我想做這樣的事情：

from lxml import html
import requests

page = requests.get('https://a-website.com/')

但是，我不想傳遞定義的硬編碼 url，而是想獲取當前在 Web 瀏覽器中打開的頁面。 即page = requests.get(whateverisopeninmychrome) 。 對於它的價值，它是我專門尋找的 div 的文本內容。

有什么辦法可以做到這一點，或者甚至有可能嗎？ 我找不到有關從您計算機上當前打開的瀏覽器中提取 html/內容的任何其他信息。

Answer 1

不，你不能喜歡這個。 一種方法是在Google Chrome或Firefox上打開開發者控制台，同時打開您的網站並使用如下 javascript 語法：

要按 className搜索，它將返回一個列表，您必須獲得一個元素：

var html = document.getElementsByClassName('htmlClassHere')[0].innerText

對於按id搜索，它將返回元素，您可以像這樣使用它：

var html = document.getElementsById('htmlIdHere').innerText