如何从 csv 导入 scrapy 的 start_urls？

Question

我尝试从 csv 文件中抓取几个网址（全部在 1 列中）。 但是，代码不返回任何内容。 谢谢，妮可

import scrapy
from scrapy.http import HtmlResponse
from scrapy.http import Request
import csv

scrapurls = ""

def get_urls_from_csv():
    with open("produktlink_test.csv", 'rbU') as csv_file:
        data = csv.reader(csv_file)
        scrapurls = []
        for row in data:
            scrapurls.append(column)
            return scrapurls

class GetlinksgalaxusSpider(scrapy.Spider):
    name = 'getlinksgalaxus'
    allowed_domains = []
    
    # An dieser Stelle definieren wir unsere Zieldomains
    start_urls = scrapurls

    def parse(self, response):

    ....

Answer 1

上一个答案：如何遍历多个 URL 以从 Scrapy 中的 CSV 文件中抓取？l

此外，最好将所有方法放入 Scrapy 蜘蛛并显式添加 start_requests。

如何从 csv 导入 scrapy 的 start_urls？

问题描述

1 个解决方案

解决方案1
0 2021-04-20 08:49:49

如何从 csv 导入 scrapy 的 start_urls？

问题描述

1 个解决方案

解决方案1 0 2021-04-20 08:49:49

解决方案1
0 2021-04-20 08:49:49