簡體   English   中英

在http服務器上查找最新文件(python)

[英]Find the most recent file on a http server (python)

我有一個網站: http : //planet.osm.ch/replication/hour/000/006/ ,我需要獲取服務器上列出的最新文件。 如何通過python 2.6.x並僅使用標准庫來完成此操作。

謝謝

編輯:

當我指的是最新文件時,我指的是日期字段中列出的最新文件。

許多人喜歡將美麗湯用於這些任務。 但是由於您只想使用標准庫,因此這里是使用re和urllib2模塊的快速解決方案。

import urllib2
import re
page = urllib2.urlopen(Your_site).read()
print re.findall(r"<a.+>(\d+.+)</a>",page)[-1]

注意:我知道使用re解析HTML是一種不好的做法,但這是一個簡單的網站,問題是這樣的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM