[英]If a website gives a 302 HTTP response code, can I get the original link's raw HTML still?
我正在嘗試使用Python在請求庫中獲取自動重定向到另一個網站的HTML。 如何避免這種情況,並在可能的情況下獲取原始網站的HTML? 我知道它存在並且具有HTML,因為我已經通過Chrome視圖源功能訪問了它。 任何幫助表示贊賞。
基本上你不會。 如果Web服務器返回302,除非它決定包括舊的html(這很奇怪),否則您基本上不走運。
現在,如果您使用網絡瀏覽器訪問它,但它不會重定向您,那么它可能正在執行類似用戶代理嗅探和基於該重定向的操作。 因此,在那種情況下,您將需要您的代碼聲明自己是那個ua。
我知道這很舊,但是我在側邊欄中看到了它,並想為將來的讀者解答。
如果在使用請求時將allow_redirects
設置為False
,它將在第一個302處停止並允許您獲取源代碼。
因此, r = requests.get(url, allow_redirects=False)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.