如何使用wget从相同的URL下载软件的最新版本

Question

我想从一些URL下载最新的软件（WRF）源代码，然后自动执行安装过程。 以下是一个示例网址：-

http://www2.mmm.ucar.edu/wrf/src/WRFV3.6.1.TAR.gz

在上述网址中，版本号可能会在开发人员发布新版本后不时更改。 现在，我想从主脚本中下载最新的可用版本。 我尝试了以下方法：

wget -k -l 0 "http://www2.mmm.ucar.edu/wrf/src/" -O index.html ; cat index.html | grep -o 'http:[^"]*.gz' | grep 'WRFV'

使用以上代码，我可以拉出该软件的所有可用版本。 上面的代码输出如下：

http://www2.mmm.ucar.edu/wrf/src/WRFV2.0.3.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV2.1.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV2.1.2.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV2.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV2.2.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV2.2.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.0.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.0.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.1.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.2.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.2.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.3.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.3.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.4.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.4.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.5.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.5.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.6.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Chem-3.6.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3-Var-do-not-use.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.0.1.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.0.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.1.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.2.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.2.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.2.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.3.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.3.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.4.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.4.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.5.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.5.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.6.1.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.6.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3.TAR.gz
http://www2.mmm.ucar.edu/wrf/src/WRFV3_OVERLAY_3.0.1.1.TAR.gz

但是，我无法进一步过滤掉链接中的更高版本。

Answer 1

关于添加数字排序并取第一行呢？

   wget -k -l 0 "http://www2.mmm.ucar.edu/wrf/src/" -O index.html ; cat index.html | grep -o 'http:[^"]*.gz' | grep 'WRFV[0-9]*[0-9]\.[0-9]'  | sort -r -n | head -1

Answer 2

通常，为了处理html页面，我会推荐一些perl工具，但是由于这是目录索引输出，（可能）可以通过bash工具（例如grep sed等）来完成。

以下代码分为几个较小的bash函数，以方便更改

#!/bin/bash

#getdata - should output html source of the page
getdata() {
    #use wget with output to stdout or curl or fetch
    curl -s "http://www2.mmm.ucar.edu/wrf/src/"
    #cat index.html
}

#filer_rows - get the filename and the date columns
filter_rows() {
    sed -n 's:<tr><td.*href="\([^"]*\)">.*>\([0-9].*\)</td>.*</td>.*</td></tr>:\2@\1:p' | grep "${1:-.}"
}

#sort_by_date - probably don't need comment... sorts the lines by date... ;)
sort_by_date() {
    while IFS=@ read -r date file
    do
        echo "$(date --date="$date" +%s)@$file"
    done | sort -gr
}

#MAIN
file=$(getdata | filter_rows WRFV | sort_by_date | head -1 | cut -d@ -f2)
echo "You want download: $file"

版画

You want download: WRFV3-Chem-3.6.1.TAR.gz

如何使用wget从相同的URL下载软件的最新版本

问题描述

2 个解决方案

解决方案1
0 2014-10-06 15:03:58

解决方案2
0 已采纳 2014-10-06 15:36:21

如何使用wget从相同的URL下载软件的最新版本

问题描述

2 个解决方案

解决方案1 0 2014-10-06 15:03:58

解决方案2 0 已采纳 2014-10-06 15:36:21

解决方案1
0 2014-10-06 15:03:58

解决方案2
0 已采纳 2014-10-06 15:36:21