[英]Can't collect pagination
while page <= last_page
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
puts pagination
doc2=Nokogiri::HTML(Curl.get(pagination).body_str)
links=doc2.xpath('//a[@class="product-name"]/@href')
links.each do |url|
doc3=Nokogiri::HTML(Curl.get(url).body_str)
name1=doc3.xpath('//h1[@class="product_main_name"]').text
puts name1
end
page +=1
end
但是,由于某种原因,它会从首页收集4次信息,而不是从所有4页收集信息。 可能是什么问题?
编辑:我在pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
错过了'p' pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
结案
这是一个简单的错字。 只需更换
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?=#{page}")
同
pagination=("https://www.petsonic.com/snacks-huesos-para-perros/?p=#{page}")
注意查询参数中的p
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.