Scrapy + Python + Xpath：Xpath返回一個空列表

Question

我寫了這個xpath：

response.xpath('//li[@class="geodir-active-slide"]/img/@src').extract()

它返回了空列表。 它應該已經返回了gif和jpg文件的鏈接。 為什么？

Answer 1

問題不在於您的XPath表達式中，而是假設您要查找的元素位於Scrapy下載的頁面原始HTML文件中。

Scrapy不會運行任何JavaScript文件，因此在許多情況下，您在Scrapy中獲得的響應與在開發人員工具中看到的響應是不同的。

如果使用瀏覽器中的“查看頁面源”選項打開相同的網站，則會看到所需的元素不存在。 這意味着該元素是使用JavaScript動態生成的。

有一些方法可以解決此問題，我將按以下順序進行處理：