[英]Find the most recent file on a http server (python)
我有一個網站: http : //planet.osm.ch/replication/hour/000/006/ ,我需要獲取服務器上列出的最新文件。 如何通過python 2.6.x並僅使用標准庫來完成此操作。
謝謝
編輯:
當我指的是最新文件時,我指的是日期字段中列出的最新文件。
許多人喜歡將美麗湯用於這些任務。 但是由於您只想使用標准庫,因此這里是使用re和urllib2模塊的快速解決方案。
import urllib2
import re
page = urllib2.urlopen(Your_site).read()
print re.findall(r"<a.+>(\d+.+)</a>",page)[-1]
注意:我知道使用re解析HTML是一種不好的做法,但這是一個簡單的網站,問題是這樣的。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.