簡體   English   中英

在使用請求和 beautifulsoup 抓取頁面時接受 cookies

[英]Accepting cookies while scraping page with requests and beautifulsoup

我做了一個腳本,在許多不同的頁面上跟蹤產品的價格。 問題是某些網站使用 cookies,您必須單擊接受 cookies 才能看到價格。

這可能無濟於事,但這是瑞典語的網站,所以你們中的許多人都不會理解。

如何在 web 刮擦時接受 cookies?

沒有 cookies 參與請求。 我覺得你不應該在執行 get 或 post 請求時遇到任何問題。

編輯:試試這段代碼:

r = requests.get('https://www.google.com/')

with open('test.html', 'w') as f:
    f.write(r.text)
    f.close()

在 web 瀏覽器中運行test.html文件並嘗試查看差異。 test.html是您的代碼所看到的,這與普通人在具有完整 GUI 的 web 瀏覽器中看到的不同。

當你抓取一個網站時,你不必接受那些 cookies。 但是,如果您想接受,則只需單擊網站上的“接受按鈕”即可。 您可以使用以下方法執行此操作:

右鍵單擊網站獲取 X-Path 並檢查 cookie 按鈕。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM