Scrapy CrawlerProcess 找不到正確的數據

Question

我試圖在這個url上刮掉不同的 18 艘船（開始時只有第一頁）。

但要這樣做，我只想要船的詳細信息 url 可以在 div.col-6-12.mobile-col-1-1.envItem > article > data-product-url 中找到

為此，我執行了以下腳本：

import scrapy
from scrapy.crawler import CrawlerProcess

class QuotesSpider(scrapy.Spider):
    name = 'quotes'
    
    def parse(self, response):
        for boat in response.css('div.col-6-12.mobile-col-1-1.envItem'):
            yield {
                'url': boat.css('article::attr("data-product-url")').get()
            }
            
# run spider
process = CrawlerProcess()
process.crawl(QuotesSpider, start_urls = ['https://www.clickandboat.com/uk/boat-hire/search?where=Spain'])
process.start()

該腳本正在運行，我收到了 18 個船只詳細信息的 url，但它們屬於不在我想抓取的 url 第一頁中的船只。

我究竟做錯了什么？ 如何獲取我放的 url 的船詳細信息的 url 列表（可以在 div.col-6-12.mobile-col-1-1.envItem > article > data-product-url 中找到）以上？

Answer 1

使用此 css 選擇器獲取數據：

import scrapy
from scrapy.crawler import CrawlerProcess

class QuotesSpider(scrapy.Spider):
    name = 'quotes'

    def parse(self, response):
        for boat in response.css('div#product-list.productList'):
            yield {
                'url': boat.css('div.col-6-12.mobile-col-1-1.envItem>article.boatAd.js-boatAd::attr("data-product-url")').getall()
            }

# run spider
process = CrawlerProcess()
process.crawl(QuotesSpider, start_urls = ['https://www.clickandboat.com/uk/boat-hire/search?where=Spain'])
process.start()

Scrapy CrawlerProcess 找不到正確的數據

問題描述

1 個解決方案

解決方案1
0 2020-12-20 12:18:17

Scrapy CrawlerProcess 找不到正確的數據

問題描述

1 個解決方案

解決方案1 0 2020-12-20 12:18:17

解決方案1
0 2020-12-20 12:18:17