Scrapy + python：csv 文件未按正確順序導出

Question

我正在用我的蜘蛛創建一個 csv 文件，但它給了我一個奇怪的數據順序：

我的代碼：

class GoodmanSpider(scrapy.Spider):
name = "goodmans"
start_urls = ['http://www.goodmans.net/d/1706/brands.htm']

def parse(self, response):
    items = TutorialItem()
    all_data = response.css('.SubDepartments')
    for data in all_data:
        category = data.css('.SubDepartments a::text').extract()
        category_url = data.css('.SubDepartments a::attr(href)').extract()
        items['category'] = category
        items['category_url'] = category_url
        yield items

我的 items.py 文件

我得到的輸出：

我想要的輸出，或多或少：

Answer 1

您已將所有物品堆疊成一個。 當您有一個列表時，每個項目都應該是每個鍵的單個值的字典。

嘗試類似：

for cat, url in zip(category, category_url):
    item = dict(category=cat, category_url=url)
    yield item

Answer 2

這是基於邁克爾的回答的代碼更正。 完美運行

import scrapy
from ..items import TutorialItem
import pandas as pd

class GoodmanSpider(scrapy.Spider):
    name = "goodmans"
    start_urls = ['http://www.goodmans.net/d/1706/brands.htm']

    def parse(self, response):
        items = TutorialItem()
        all_data = response.css('.SubDepartments')
        for data in all_data:
            category = data.css('.SubDepartments a::text').extract()
            category_url = data.css('.SubDepartments a::attr(href)').extract()
            items['category'] = category
            items['category_url'] = category_url
            for cat, url in zip(category, category_url):
                item = dict(category=cat, category_url=url)
                yield item

Scrapy + python：csv 文件未按正確順序導出

問題描述

2 個解決方案

解決方案1
1 已采納 2020-03-19 17:01:12

解決方案2
0 2020-03-19 17:36:30

Scrapy + python：csv 文件未按正確順序導出

問題描述

2 個解決方案

解決方案1 1 已采納 2020-03-19 17:01:12

解決方案2 0 2020-03-19 17:36:30

解決方案1
1 已采納 2020-03-19 17:01:12

解決方案2
0 2020-03-19 17:36:30