如何使用Python从网站下载文本文件？

Question

我需要编写一个函数，该函数可以从http://www.namejet.com/pages/downloads.aspx.下载并存储今天的预发布域.txt文件列表http://www.namejet.com/pages/downloads.aspx. 因此，由于今天是10月8日，因此您想要获取文件“ 2012年10月8日，星期一”。 尝试了请求，但没有成功。 我遇到了麻烦，因为该文件未存储在固定的URL上，但隐藏在某些Javascript后面。

Answer 1

在处理ASP.NET的回发系统时，这有些棘手。 如果这不是用于个人脚本，则我会警惕，因为您不仅在有效地使用另一个站点的数据，而且还对它们的软件进行了反向工程（但是，IANAL并不了解有关这些问题的合法性）系统）。

您要做的是检查POST数据（使用Firebug，Chrome开发人员工具等），然后查找表单对象的__EVENTTARGET和__VIEWSTATE属性。 您必须解码__VIEWSTATE才能使其可读（请查看http://ignatu.co.uk/ViewStateDecoder.aspx ）。 从那里，我认为您应该能够弄清楚如何获取所需的数据。

在Python中，它非常简单：

from urllib2 import urlopen
from urllib import urlencode

data = urlopen('url', urlencode({
    '__VIEWSTATE': 'foo',
    '__EVENTTARGET': 'bar',
})).read()

Answer 2

实际上，您将获得文本文件，以响应具有多个base64编码的请求参数的POST请求。 随意玩

使用Firebug或任何其他调试工具查看POST的内容和参数

如何使用Python从网站下载文本文件？

问题描述

2 个解决方案

解决方案1
2 已采纳 2012-10-08 06:25:33

解决方案2
1 2012-10-08 05:30:38

如何使用Python从网站下载文本文件？

问题描述

2 个解决方案

解决方案1 2 已采纳 2012-10-08 06:25:33

解决方案2 1 2012-10-08 05:30:38

解决方案1
2 已采纳 2012-10-08 06:25:33

解决方案2
1 2012-10-08 05:30:38