簡體   English   中英

如何從Skyscanner獲取數據?

[英]How to fetch data from Skyscanner?

www.skyscanner.net Python,因此有人要求從www.skyscanner.net獲取動態數據。

有人可以指導我這樣做嗎?

import requests
import lxml.html as lh

url = 'http://www.skyscanner.net/transport/flights/sin/lhr/131231/140220/'
response = requests.post(url)

tree = lh.document_fromstring(response.content)
print(tree);

我要做的就是在URL中找到模式,然后嘗試從那里抓取。 但是,沒有成功提取任何數據。 我了解到Python是執行此類任務的最佳語言,但是該庫似乎太大了,我不知道從哪里開始。

我的名字叫Piotr-我在Skyscanner工作-在數據采集團隊中-我假設您正在申請加入:-)因為這是您工作的一部分,所以我不想給您一個直接的答案,但是您可能會考慮:

  • 了解我們網站的工作方式-如何構建請求以及可以在http響應中找到哪些數據。
  • 您可以使用一些庫來幫助您解析xml / json響應

我想這就是我能說的:-)

歡呼聲

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM