Python：Scrapy CSV導出錯誤？

Question

我只是想寫一個csv。 但是，我有兩個單獨的For-Statement，因此每個For-Statement的數據都獨立導出並中斷順序。 建議？

def parse(self, response):
        hxs = HtmlXPathSelector(response)
        titles = hxs.select('//td[@class="title"]')
        subtext = hxs.select('//td[@class="subtext"]')
        items = []
        for title in titles:
            item = HackernewsItem()
            item["title"] = title.select("a/text()").extract()
            item["url"] = title.select("a/@href").extract()
            items.append(item)
        for score in subtext:
            item = HackernewsItem()
            item["score"] = score.select("span/text()").extract()
            items.append(item)
        return items

從下圖中可以明顯看出，第二個for語句在標題下打印，而不是在標題中“打印”。

附上CSV圖片： CSV文件

和完整文件的github鏈接： https ： //github.com/nchlswtsn/scrapy/blob/master/items.csv

Answer 1

您導出元素的順序與在CSV文件中找到的邏輯順序一致，首先導出所有標題，然后導出所有子文本元素。
我想您正在嘗試刪除HN文章，這是我的建議：

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    titles = hxs.select('//td[@class="title"]')
    items = []
    for title in titles:
        item = HackernewsItem()
        item["title"] = title.select("a/text()").extract()
        item["url"] = title.select("a/@href").extract()
        item["score"] = title.select('../td[@class="subtext"]/span/text()').extract()
        items.append(item)
    return items

我沒有測試它，但是它將給您一個想法。

Answer 2

Python 2.7中的CSV模塊不支持Unicode，因此建議改用unicodecsv 。

$pip install unicodecsv

unicodecsv是Python 2的csv模塊的直接替代品，該模塊支持Unicode字符串而沒有麻煩。

然后用它代替import csv

import unicodecsv as csv

Python：Scrapy CSV導出錯誤？

問題描述

2 個解決方案

解決方案1
2 已采納 2015-04-22 21:18:01

解決方案2
1 2015-04-22 20:32:44

Python：Scrapy CSV導出錯誤？

問題描述

2 個解決方案

解決方案1 2 已采納 2015-04-22 21:18:01

解決方案2 1 2015-04-22 20:32:44

解決方案1
2 已采納 2015-04-22 21:18:01

解決方案2
1 2015-04-22 20:32:44