Python Selenium - 如何获取页面上的所有网址，这些网址仅在单击 div 后才加载链接？

Question

我正在尝试使用 Selenium 从页面https://www.zapimoveis.com.br/aluguel/apartamentos/sp+sao-paulo+zona-sul+itaim-bibi/中删除结果，但我一直无法获得每个结果的 url。 可以肯定地说，每张卡片的 url 都没有存储在<a>元素中，而且显然根本没有存储在每个 div 的内部 html 的任何位置。

获取地址的唯一方法是单击 div，这会打开一个新选项卡。 目前，我正在使用 selenium 来点击每一个，复制地址然后关闭选项卡，但这不仅是一个更加复杂和耗时的过程，而且还可能通过向网站发出那么多请求来触发一些验证码。

有没有办法在没有这个点击过程的情况下获取此页面上所有优惠的网址？ 我尝试在 chrome 上使用检查工具，但无法弄清楚这种行为的 js 或 wtv 是什么。

谢谢！

Answer 1

我查看了该站点，看起来每个卡片容器都有一个可用于访问列表的数据 ID。 此卡的链接：

<div data-id="2593637292" class="card-container js-listing-card">{THE HTML FOR THAT CARD}</div>

将是https://www.zapimoveis.com.br/imovel/2593637292 。

Python Selenium - 如何获取页面上的所有网址，这些网址仅在单击 div 后才加载链接？

问题描述

1 个解决方案

解决方案1
2 已采纳 2022-11-20 00:24:40

Python Selenium - 如何获取页面上的所有网址，这些网址仅在单击 div 后才加载链接？

问题描述

1 个解决方案

解决方案1 2 已采纳 2022-11-20 00:24:40

解决方案1
2 已采纳 2022-11-20 00:24:40