繁体 English 中英

Python lxml xpath不返回任何输出

[英]Python lxml xpath returns no output

原文 2017-04-27 11:03:32 4 1 python/ xpath/ web-scraping/ lxml

我尝试在Python中使用lxml在网站上抓取特定元素。 您可以在下面找到我的代码，但是没有输出。

    from lxml import html

    webpage = 'http://www.funda.nl/koop/heel-nederland/'
    page = requests.get(webpage)
    tree = html.fromstring(page.content)

    content = '//*[@id="content"]/form/div[2]/div[5]/div/a[8]/text()'
    content = str(tree.xpath(content))
    print content

1 个解决方案

您尝试剪贴的网站似乎不喜欢被剪贴。 他们利用各种技术来检测请求是来自合法用户还是来自机器人，并阻止访问（如果认为来自机器人）。 这就是为什么您的xpath找不到任何东西的原因，这就是为什么您应该重新考虑所做的事情的原因。

如果您决定继续，那么欺骗该特定网站的最简单方法似乎是向您的请求添加cookie。

首先，使用您的真实浏览器获取cookie字符串：

开启新分页
开放开发人员工具
转到开发人员工具中的“网络”标签
如果网络标签为空，请刷新页面
查找对heel-nederland/请求，然后单击
在“请求标题”中，您将找到cookie字符串-它很长，并且包含许多看似随机的字符。 复制它

然后，修改程序以使用这些cookie：

import requests
from lxml import html

webpage = 'http://www.funda.nl/koop/heel-nederland/'
headers = {
        'Cookie': '<string copied from browser>'
        }
page = requests.get(webpage, headers=headers)
tree = html.fromstring(page.content)

selector = '//*[@id="content"]/form/div[2]/div[5]/div/a[8]/text()'
content = str(tree.xpath(selector))
print content

Python -lxml xpath返回空列表

[英]Python -lxml xpath returns empty list

Python LXML XPATH使用有效查询返回错误

[英]Python LXML XPATH Returns Error With Valid Query

Python lxml xpath - 返回所有标签而不是选择

[英]Python lxml xpath - returns all tags instead of selected

在 Python 中使用 XPath 和 LXML

[英]Using XPath in Python with LXML

Python lxml XPath问题

[英]Python lxml XPath problem

使用Python lxml的XML XPath搜索无法对text（）输出进行过滤

[英]XML XPath search with Python lxml fails to filter on text() output

Lxml xpath 返回一个空数组

[英]Lxml xpath returns an empty array

lxml xpath返回一个空列表

[英]lxml xpath returns an empty list

使用lxml`.xpath（）`和`for`的意外输出

[英]Unexpected output using lxml `.xpath()` and `for`

使用 LXML 在 Python 中查找字符串的 XPath

[英]Find the XPath of a string in Python with LXML

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Python -lxml xpath返回空列表 Python LXML XPATH使用有效查询返回错误 Python lxml xpath - 返回所有标签而不是选择在 Python 中使用 XPath 和 LXML Python lxml XPath问题使用Python lxml的XML XPath搜索无法对text（）输出进行过滤 Lxml xpath 返回一个空数组 lxml xpath返回一个空列表使用lxml`.xpath（）`和`for`的意外输出使用 LXML 在 Python 中查找字符串的 XPath

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM