使用請求在 Python 中不使用 Javascript 的 Web 抓取

Question

所以，我正在制作一個 Python 腳本，它獲取網頁內容並將其與之前保存的版本進行比較，以查看網頁是否已更改。 我正在使用這種方法獲取原始內容：

def getcontent(url):
    str = requests.get(url)
    str = str.text
    return(str)

之后，我正在清理內容並引用 escaping 等，但這無關緊要。 我一直遇到的問題是，網頁有一些 JavaScript 代碼，它會生成我的方法下載的唯一密鑰。 每次抓取網頁內容，key都不一樣。 我對那把鑰匙的用途一無所知。 問題是，如果密鑰不同，新內容和保存的內容就不一樣了。

當我請求網頁時，如何禁用 JavaScript 運行？

Answer 1

令牌是在服務器端生成的，可以用於各種原因（例如 CSRF-token）

令牌將始終在您的響應內容中，不需要 JavaScript。

您應該找到一種忽略/刪除令牌的方法。

使用請求在 Python 中不使用 Javascript 的 Web 抓取

問題描述

1 個解決方案

解決方案1
0 已采納 2020-04-15 00:16:19

使用請求在 Python 中不使用 Javascript 的 Web 抓取

問題描述

1 個解決方案

解決方案1 0 已采納 2020-04-15 00:16:19

解決方案1
0 已采納 2020-04-15 00:16:19