从特定网站下载所有可用的 CSV 和 KML 文件

Question

我正在尝试使用 python 来自动化从 data.gov.sg 下载所有可用 CSV 和 KML 文件的过程。 但是，我们收到了“HTTP 错误 403：禁止”错误消息。 我们曾经遇到过robots.txt 错误，该错误已解决。 我们下面的编码有什么问题吗？

import mechanize
from time import sleep
br = mechanize.Browser()

br.open('https://data.gov.sg/')

f=open("source.html","w")
f.write(br.response().read()) 
f.close()

filetypes=[".csv",".kml"] 
myfiles=[]
for l in br.links(): 
    for t in filetypes:
        if t in str(l): 
            myfiles.append(l)


def downloadlink(l):
    f=open(l.text,"w") 
    br.click_link(l)
    f.write(br.response().read())
    f.close()
    print l.text," has been downloaded"
#br.back()

for l in myfiles:
    sleep(1) 
    downloadlink(l)

Answer 1

HTTP 403 错误http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html#sec10.4.4表示您已被禁止访问，要么您需要授权访问此权限，要么服务器管理员已阻止您访问它并发送 403 响应作为通知。

因此，我可以看到您的代码没有任何问题（尽管您似乎丢失了缩进），这会导致此问题。

从特定网站下载所有可用的 CSV 和 KML 文件

问题描述

1 个解决方案

解决方案1
0 2015-11-24 03:36:01

从特定网站下载所有可用的 CSV 和 KML 文件

问题描述

1 个解决方案

解决方案1 0 2015-11-24 03:36:01

解决方案1
0 2015-11-24 03:36:01