繁体   English   中英

如何从Skyscanner获取数据?

[英]How to fetch data from Skyscanner?

www.skyscanner.net Python,因此有人要求从www.skyscanner.net获取动态数据。

有人可以指导我这样做吗?

import requests
import lxml.html as lh

url = 'http://www.skyscanner.net/transport/flights/sin/lhr/131231/140220/'
response = requests.post(url)

tree = lh.document_fromstring(response.content)
print(tree);

我要做的就是在URL中找到模式,然后尝试从那里抓取。 但是,没有成功提取任何数据。 我了解到Python是执行此类任务的最佳语言,但是该库似乎太大了,我不知道从哪里开始。

我的名字叫Piotr-我在Skyscanner工作-在数据采集团队中-我假设您正在申请加入:-)因为这是您工作的一部分,所以我不想给您一个直接的答案,但是您可能会考虑:

  • 了解我们网站的工作方式-如何构建请求以及可以在http响应中找到哪些数据。
  • 您可以使用一些库来帮助您解析xml / json响应

我想这就是我能说的:-)

欢呼声

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM