嘗試解析列表數據時，Scrapy拋出Traceback

Question

我在Windows Vista 64位上運行Scrapy.org版本2.7 64位。 我有一些Scrapy代碼試圖在以下代碼中包含的URL處解析表中包含的數據：

from scrapy.spider import Spider
from scrapy.selector import Selector
from scrapy.utils.markup import remove_tags
from scrapy.cmdline import execute
import re


class MySpider(Spider):
    name = "wiki"
    allowed_domains = ["whoscored.com"]
    start_urls = ["http://www.whoscored.com/Players/3859/Fixtures/Wayne-Rooney"]

def parse(self, response):

    for row in response.selector.xpath('//table[@id="player-fixture"]//tr[td[@class="tournament"]]'):
    # Is this row contains goal symbols?
        list_of_goals = row.xpath('//span[@title="Goal"')
        if list_of_goals:
            print remove_tags(list_of_goals).encode('utf-8')     

execute(['scrapy','crawl','wiki'])

但是，它引發以下錯誤：

Traceback (most recent call last):
  File "c:\Python27\lib\site-packages\twisted\internet\base.py", line 1201, in mainLoop
    self.runUntilCurrent()
  File "c:\Python27\lib\site-packages\twisted\internet\base.py", line 824, in runUntilCurrent
    call.func(*call.args, **call.kw)
  File "c:\Python27\lib\site-packages\twisted\internet\defer.py", line 383, in callback
    self._startRunCallbacks(result)
  File "c:\Python27\lib\site-packages\twisted\internet\defer.py", line 491, in _startRunCallbacks
    self._runCallbacks()
--- <exception caught here> ---
  File "c:\Python27\lib\site-packages\twisted\internet\defer.py", line 578, in _runCallbacks
    current.result = callback(current.result, *args, **kw)
  File "c:\Python27\lib\site-packages\scrapy\spider.py", line 56, in parse
    raise NotImplementedError
exceptions.NotImplementedError:

誰能告訴我這里的問題是什么？ 我正在嘗試對表中的所有項目進行屏幕打印，包括目標和輔助列中的數據。

謝謝

Answer 1

您的縮進是錯誤的：

class MySpider(Spider):
    name = "wiki"
    allowed_domains = ["whoscored.com"]
    start_urls = ["http://www.whoscored.com/Players/3859/Fixtures/Wayne-Rooney"]

    def parse(self, response):

        for row in response.selector.xpath('//table[@id="player-fixture"]//tr[td[@class="tournament"]]'):
        # Is this row contains goal symbols?
            list_of_goals = row.xpath('//span[@title="Goal"')
            if list_of_goals:
                print remove_tags(list_of_goals).encode('utf-8')

使用Spider class時，必須實現parse方法，這就是該方法在源代碼中的樣子：

def parse(self, response):
        raise NotImplementedError

您的縮進是錯誤的，因此解析不是該類的一部分，因此您尚未實現所需的方法。

raise NotImplementedError可以確保在從Spider基類繼承時編寫所需的parse方法。

現在，您只需要找到正確的xpath ;）

嘗試解析列表數據時，Scrapy拋出Traceback

問題描述

1 個解決方案

解決方案1
2 已采納 2014-07-13 23:55:44

嘗試解析列表數據時，Scrapy拋出Traceback

問題描述

1 個解決方案

解決方案1 2 已采納 2014-07-13 23:55:44

解決方案1
2 已采納 2014-07-13 23:55:44