簡體   English   中英

如何訪問要從中提取數據的網站的控制台?

[英]How do I access the console of the website that I want to extract data from?

抱歉標題混亂。 我是 JavaScript 的初學者,想構建這個小項目來提高我的技能水平:圖像提取器。 用戶可以在表單輸入中輸入網站名稱。 按 Extract,所有圖像的鏈接都會顯示出來。

問題:如何訪問輸入字段中輸入的網站 DOM?

正如@Quentin 在評論中提到的,瀏覽器對這樣的跨域請求實施了限制。 同源策略將阻止您的站點在不同域中提取頁面的 HTML 源。

由於這是一個學習練習,我建議選擇另一個不會涉及跨域請求安全問題的任務。 或者,您可以使用 Node (JavaScript)、Python、PHP、Ruby 或許多其他腳本語言在瀏覽器外實現這樣的“抓取器”。

如果你已經有了 html 內容,你可以嘗試這樣的事情:

var html = document.createElement('html');
html.innerHTML = "<html><body><div><img src='image-url.png'></div></body></html>";
console.log(html.querySelector("img").src);

如果您還需要通過 ajax 調用獲取內容,我建議您使用scrapy 之類的東西來完成整個代碼服務器端

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM