繁体   English   中英

使用ruby机械化刮aspx站点时出错。 机械化:: ResponseCodeError:404 => Net :: HTTPNotFound

[英]Error scraping aspx site with ruby Mechanize. Mechanize::ResponseCodeError: 404 => Net::HTTPNotFound

我正在尝试使用Ruby的机械化方法来刮除评级网站,并遇到了很多麻烦。 我的代码很简单:

require "mechanize"
@client.get("http://cape.ucsd.edu/responses/Results.aspx")

届时,您将看到404错误。

我尝试了一些事情,包括HTTParty搜索重定向; 禁用SSL检查; 甚至将html文件保存在本地(以获取正确的查询表单),然后尝试直接从连接到主站点的代理发出该文件。 所有这些导致相同的错误。

我对抓取还很陌生,希望自己做的事很傻。 任何帮助,将不胜感激。

是的,它是用户代理。 要设置用户代理,请执行以下操作:

@client = Mechanize.new
@client.user_agent = 'Mozilla'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM