如何解决“ IndexError：列表索引超出范围”？

Question

我正在用python 3 scrapy刮目录。 抓取的数据通过pipelines.py添加到Mysql数据库中

我经常收到此错误消息“ IndexError：列表索引超出范围”。

对于这个问题，当我抓取链接的网址时就会发生。 有时目录发布项目的网站，有时不发布。

我在stackoverflows上找不到任何解决方案。 我试图将其转换为字符串，但不起作用。

这是产生此错误的代码行：

items['startup_website'] = response.xpath("//div[@class='listing-detail- section-content-wrapper']//a/@href")[0].get() or ''

有谁知道我该如何解决这个错误？

Answer 1

不需要索引。 您应该完全跳过它。

.xpath()返回一个SelectorList ，它具有自己的.get()方法。
使用它会得到想要的结果：

>>> fetch('http://example.com')
2019-08-14 14:28:03 [scrapy.core.engine] DEBUG: Crawled (200) <GET http://example.com> (referer: None)
>>> response.xpath('//a/@href').get('')
'http://www.iana.org/domains/example'
>>> response.xpath('//fake/a/@href').get('')
''

Answer 2

[0]此处过多。 使用response.xpath("//selector").get() or ''

如何解决“ IndexError：列表索引超出范围”？

问题描述

2 个解决方案

解决方案1
3 2019-08-14 12:28:40

解决方案2
1 2019-08-14 12:27:19

如何解决“ IndexError：列表索引超出范围”？

问题描述

2 个解决方案

解决方案1 3 2019-08-14 12:28:40

解决方案2 1 2019-08-14 12:27:19

解决方案1
3 2019-08-14 12:28:40

解决方案2
1 2019-08-14 12:27:19