使用xpath / lxml刮取文本

Question

我正在尝试使用xpath / lxml从http://www.cellartracker.com/wine.asp?iWine=91411中使用“2005-2013之间的饮料”文本中删除“2005-2013”文本，并且我只能为本网站上的其他一些页面做这件事，而不是这个。 不确定我做错了/如果我从元素复制的xpath是不正确的

它告诉我：

print(content_divs[0].text_content().strip())
IndexError: list index out of range

这是我的代码：

import requests, lxml.html
page = requests.get('http://www.cellartracker.com/wine.asp?iWine=91411')
html = lxml.html.fromstring(page.content)
content_divs = html.xpath('//*[@id="wine_copy_inner"]/p/a[4]')
print(content_divs[0].text_content().strip())

谢谢你的帮助！！！

Answer 1

xpath数组是否为零索引？

//*[@id="wine_copy_inner"]/p/a[4]应该是...[3] 。

貌似数量a当您登录VS登出标签的变化。 可能想使用另一种方法来定位此标记。

Answer 2

如果你想获得"2005 - 2013"你可以使用下面的代码

content = html.xpath('//a[@title="Source: Community"]/text()')

使用xpath / lxml刮取文本

问题描述

2 个解决方案

解决方案1
0 2017-07-26 20:28:46

解决方案2
0 已采纳 2017-07-26 21:01:47

使用xpath / lxml刮取文本

问题描述

2 个解决方案

解决方案1 0 2017-07-26 20:28:46

解决方案2 0 已采纳 2017-07-26 21:01:47

解决方案1
0 2017-07-26 20:28:46

解决方案2
0 已采纳 2017-07-26 21:01:47