繁体   English   中英

Scrapy 下一页按钮和上一页按钮在同一个 class 上,无法到达下一页

[英]Scrapy Next Page Button and Previous Page Button are on the same class, can't reach the next page

我正在尝试刮一本字典。 其中有下一页和上一页按钮。 当我尝试以这种方式到达下一页(“Sonraki Sayfa”)时

next_page = response.css('div.col-md-6.col-sm-6.col-xs-6 a::attr(href)').get()

我总是到达上一页按钮,因为它们具有相同的 class 名称。

这是网站的 html 代码:

<ul class="sayfalama">
  <div class="col-md-12 col-xs-12 col-sm-12">
    <div class="row">
      <div class="col-md-6 col-sm-6 col-xs-6">
        <a href="kelimeler.php?s=-1" style="background: white; font-weight: bold; padding:5px;">Önceki Sayfa</a>
      </div>
      <div class="col-md-6 col-sm-6 col-xs-6">
        <a href="kelimeler.php?s=1" style="background: white; font-weight: bold; padding:5px;">Sonraki Sayfa</a>
      </div>
    </div>
</ul>

这是我的蜘蛛代码

next_page = response.css('div.col-md-6.col-sm-6.col-xs-6 a::attr(href)').get()
print(next_page)

if next_page is not None:

  yield response.follow(next_page, callback = self.parse)

应该改变什么才能到达下一页(Sonraki Sayfa)而不是上一页(Onceki Sayfa)?

您可以尝试使用nth-child 如下所示:

next_page = response.css('div.col-md-6.col-sm-6.col-xs-6:nth-child(2) a::attr(href)').get()

 div.col-md-6.col-sm-6.col-xs-6:nth-child(2) a { color:red; }
 <div class="col-md-6 col-sm-6 col-xs-6"> <a href="kelimeler.php?s=-1" style="background: white; font-weight: bold; padding:5px;">Önceki Sayfa</a> </div> <div class="col-md-6 col-sm-6 col-xs-6"> <a href="kelimeler.php?s=1">Sonraki Sayfa</a> </div>

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM