[英]How can I get text/html from a web page I currently have open in a browser on my machine?
我想做這樣的事情:
from lxml import html
import requests
page = requests.get('https://a-website.com/')
但是,我不想傳遞定義的硬編碼 url,而是想獲取當前在 Web 瀏覽器中打開的頁面。 即page = requests.get(whateverisopeninmychrome)
。 對於它的價值,它是我專門尋找的 div 的文本內容。
有什么辦法可以做到這一點,或者甚至有可能嗎? 我找不到有關從您計算機上當前打開的瀏覽器中提取 html/內容的任何其他信息。
不,你不能喜歡這個。 一種方法是在Google Chrome或Firefox上打開開發者控制台,同時打開您的網站並使用如下 javascript 語法:
要按 className搜索,它將返回一個列表,您必須獲得一個元素:
var html = document.getElementsByClassName('htmlClassHere')[0].innerText
對於按id搜索,它將返回元素,您可以像這樣使用它:
var html = document.getElementsById('htmlIdHere').innerText
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.