簡體   English   中英

Python Selenium - 如何獲取頁面上的所有網址,這些網址僅在單擊 div 后才加載鏈接?

[英]Python Selenium - how to get all urls on a page that only load the link after clicking on the div?

我正在嘗試使用 Selenium 從頁面https://www.zapimoveis.com.br/aluguel/apartamentos/sp+sao-paulo+zona-sul+itaim-bibi/中刪除結果,但我一直無法獲得每個結果的 url。 可以肯定地說,每張卡片的 url 都沒有存儲在<a>元素中,而且顯然根本沒有存儲在每個 div 的內部 html 的任何位置。

獲取地址的唯一方法是單擊 div,這會打開一個新選項卡。 目前,我正在使用 selenium 來點擊每一個,復制地址然后關閉選項卡,但這不僅是一個更加復雜和耗時的過程,而且還可能通過向網站發出那么多請求來觸發一些驗證碼。

有沒有辦法在沒有這個點擊過程的情況下獲取此頁面上所有優惠的網址? 我嘗試在 chrome 上使用檢查工具,但無法弄清楚這種行為的 js 或 wtv 是什么。

謝謝!

我查看了該站點,看起來每個卡片容器都有一個可用於訪問列表的數據 ID。 此卡的鏈接:

<div data-id="2593637292" class="card-container js-listing-card">{THE HTML FOR THAT CARD}</div>

將是https://www.zapimoveis.com.br/imovel/2593637292

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM