[英]Why do Ruby Net::HTTP.get_response and Net::HTTP.new(uri.host).request return different things?
这两个请求应该具有相同的结果,但是第一个请求返回200(确定),第二个请求返回404(未找到)。 这是为什么?
require 'net/http'
url = "http://readwrite.com/2013/12/04/google-compute-engine"
uri = URI(url)
Net::HTTP.get_response(uri)
#=> #<Net::HTTPOK 200 OK readbody=true>
Net::HTTP.new(uri.host).request(Net::HTTP::Get.new(url))
#=> #<Net::HTTPNotFound 404 Not Found readbody=true>
它仅在某些网址下发生。 我不知道这种模式。 这是另一个示例: http://davidduchemin.com/2014/01/towards-mastery-again/
: http://davidduchemin.com/2014/01/towards-mastery-again/
。
首先,让我们通过使用tcpdump查看它们的实际HTTP请求来比较两者,以便我们可以了解可能发生的情况:
tcpdump -vvASs 0 port 80 and host www.readwrite.com
# Net::HTTP.get_response(uri) GET /2013/12/04/google-compute-engine HTTP/1.1 Accept-Encoding: gzip;q=1.0,deflate;q=0.6,identity;q=0.3 Accept: */* User-Agent: Ruby Host: readwrite.com
# Net::HTTP.new(uri.host).request(Net::HTTP::Get.new(url)) GET http://readwrite.com/2013/12/04/google-compute-engine HTTP/1.1 Accept-Encoding: gzip;q=1.0,deflate;q=0.6,identity;q=0.3 Accept: */* User-Agent: Ruby Connection: close Host: readwrite.com
我们可以看到第二个请求错误地请求了完整的URL(带有主机名)作为路径。 这是因为您将url
传递到Net::HTTP::Get.new
,这导致Net::HTTP::Get.new(url).path
就是我们上面看到的:带有主机名的完整URL。 而是将URI实例( uri
)传递给Net::HTTP::Get.new
:
Net::HTTP.new(uri.host).request(Net::HTTP::Get.new(uri))
#=> #<Net::HTTPOK 200 OK readbody=true>
现在,它的tcpdump实际上与第一个相同:
GET /2013/12/04/google-compute-engine HTTP/1.1 Accept-Encoding: gzip;q=1.0,deflate;q=0.6,identity;q=0.3 Accept: */* User-Agent: Ruby Host: readwrite.com Connection: close
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.