Python Scrapy打印start_url或start_url中的变量

Question

Trying to yield the "number" or the maybe get the start_url then parse the start_url to get the number: 尝试产生“数字”或可能获取start_url然后解析start_url以获取数字：

class EbaypriceSpider(Spider):
    name = "ebayprice"
    allowed_domains = ["www.ebay.com"]
    start_urls = []
    with open('Numbers.csv', 'rb') as omcan_numbers:
        number_list = csv.reader(omcan_numbers)
        for number in number_list: 
            start_urls.append('http://www.ebay.com/sch/Omcan' + str(number))


    def parse(self, response):
        # DO stuff then call parse_page2


    def parse_page2(self, response):
        print number
        # I want to get get start url or number

Answer 1

instead of start_urls use the start_requests method: 代替start_urls使用start_requests方法：

class EbaypriceSpider(Spider):
    name = "ebayprice"
    allowed_domains = ["www.ebay.com"]

    def start_requests(self):
        with open('Numbers.csv','rb') as omcan_numbers:
            number_list = csv.reader(omcan_numbers)
            for number in number_list:
                url = 'http://www.ebay.com/sch/Omcan'+ str(number)
                yield Request(url, meta={'start_url':url}, callback=self.parse)

    def parse(self, response):
        # DO stuff then call parse_page2
        ...
        # keep passing the `meta` argument from previous request
        yield Request(some_other_url, meta=response.meta, callback=self.parse_page2)

    def parse_page2(self, response):
        # i want to get get start url or number
        start_url = response.meta['start_url']

Python Scrapy打印start_url或start_url中的变量

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-02-17 21:22:46

Python Scrapy打印start_url或start_url中的变量

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-02-17 21:22:46

解决方案1
2 已采纳 2017-02-17 21:22:46