繁体   English   中英

如何在 node.js http.Client 中使用 http 代理?

[英]How can I use an http proxy with node.js http.Client?

我想使用标准的http.Client从 node.js 进行传出 HTTP 调用。 但是我无法直接从我的网络访问远程服务器,需要通过代理。

我如何告诉 node.js 使用代理?

关于使用 HTTP 代理, Tim Macfarlane回答很接近。

使用 HTTP 代理(用于非安全请求)非常简单。 您连接到代理并正常发出请求,只是路径部分包含完整的 url 并且主机标头设置为您要连接的主机。
蒂姆非常接近他的答案,但他错过了正确设置主机标题。

var http = require("http");

var options = {
  host: "proxy",
  port: 8080,
  path: "http://www.google.com",
  headers: {
    Host: "www.google.com"
  }
};
http.get(options, function(res) {
  console.log(res);
  res.pipe(process.stdout);
});

作为记录,他的回答确实适用于http://nodejs.org/,但那是因为他们的服务器不在乎主机标头是否不正确。

您可以使用request ,我刚刚发现在 node.js 上使用代理非常容易,只需一个外部“代理”参数,甚至通过 http 代理支持 HTTPS。

var request = require('request');

request({
  'url':'https://anysite.you.want/sub/sub',
  'method': "GET",
  'proxy':'http://yourproxy:8087'
},function (error, response, body) {
  if (!error && response.statusCode == 200) {
    console.log(body);
  }
})

我花了一段时间才弄清楚的一件事是,使用“http”访问代理,即使您尝试代理到 https 服务器。 这对我使用 Charles(osx 协议分析器)有效:

var http = require('http');

http.get ({
    host: '127.0.0.1',
    port: 8888,
    path: 'https://www.google.com/accounts/OAuthGetRequestToken'
}, function (response) {
    console.log (response);
});

正如这里的@Renat 已经提到的,代理 HTTP 流量来自非常正常的 HTTP 请求。 针对代理发出请求,将目标的完整 URL作为路径传递。

var http = require ('http');

http.get ({
    host: 'my.proxy.com',
    port: 8080,
    path: 'http://nodejs.org/'
}, function (response) {
    console.log (response);
});

我购买了私人代理服务器,购买后我得到:

255.255.255.255 // IP address of proxy server
99999 // port of proxy server
username // authentication username of proxy server
password // authentication password of proxy server

我想使用它。 第一个答案第二个答案仅适用于 http(proxy) -> http(destination),但是我想要 http(proxy) -> https(destination)。

对于 https 目的地,最好直接使用HTTP 隧道 我在这里找到了解决方案。

节点 v8:

const http = require('http')
const https = require('https')
const username = 'username'
const password = 'password'
const auth = 'Basic ' + Buffer.from(username + ':' + password).toString('base64')

http.request({
  host: '255.255.255.255', // IP address of proxy server
  port: 99999, // port of proxy server
  method: 'CONNECT',
  path: 'kinopoisk.ru:443', // some destination, add 443 port for https!
  headers: {
    'Proxy-Authorization': auth
  },
}).on('connect', (res, socket) => {
  if (res.statusCode === 200) { // connected to proxy server
    https.get({
      host: 'www.kinopoisk.ru',
      socket: socket,    // using a tunnel
      agent: false,      // cannot use a default agent
      path: '/your/url'  // specify path to get from server
    }, (res) => {
      let chunks = []
      res.on('data', chunk => chunks.push(chunk))
      res.on('end', () => {
        console.log('DONE', Buffer.concat(chunks).toString('utf8'))
      })
    })
  }
}).on('error', (err) => {
  console.error('error', err)
}).end()

节点 v14:

const http = require('http');
const https = require('https');
const username = 'username';
const password = 'password';
const auth = 'Basic ' + Buffer.from(username + ':' + password).toString('base64');

http.request({
  host: '255.255.255.255', // IP address of proxy server
  port: 99999, // port of proxy server
  method: 'CONNECT',
  path: 'kinopoisk.ru:443', // some destination, add 443 port for https!
  headers: {
    'Proxy-Authorization': auth
  },
}).on('connect', (res, socket) => {
  if (res.statusCode === 200) { // connected to proxy server
    const agent = new https.Agent({ socket });
    https.get({
      host: 'www.kinopoisk.ru',
      path: '/',
      agent,      // cannot use a default agent
    }, (res) => {
      let chunks = []
      res.on('data', chunk => chunks.push(chunk))
      res.on('end', () => {
        console.log('DONE', Buffer.concat(chunks).toString('utf8'))
      })
    })
  }
}).on('error', (err) => {
  console.error('error', err)
}).end();

以为我会添加我发现的这个模块: https://www.npmjs.org/package/global-tunnel ,它对我很有用(立即使用我的所有代码和第三方模块,只有下面的代码)。

require('global-tunnel').initialize({
  host: '10.0.0.10',
  port: 8080
});

执行一次,应用程序中的所有 http(和 https)都会通过代理。

或者,调用

require('global-tunnel').initialize();

将使用http_proxy环境变量

“请求”http 包似乎具有此功能:

https://github.com/mikeal/request

例如,下面的“r”请求对象使用 localproxy 来访问它的请求:

var r = request.defaults({'proxy':'http://localproxy.com'})

http.createServer(function (req, resp) {
  if (req.url === '/doodle.png') {
    r.get('http://google.com/doodle.png').pipe(resp)
  }
})

不幸的是,没有“全局”默认值,因此使用它的库的用户无法修改代理,除非库通过 http 选项...

HTH,克里斯

如果您需要为您的代理提供商使用基本授权,只需使用以下内容:

var http = require("http");

var options = {
    host:       FarmerAdapter.PROXY_HOST,
    port:       FarmerAdapter.PROXY_PORT,
    path:       requestedUrl,
    headers:    {
        'Proxy-Authorization':  'Basic ' + new Buffer(FarmerAdapter.PROXY_USER + ':' + FarmerAdapter.PROXY_PASS).toString('base64')
    }
};

var request = http.request(options, function(response) {
    var chunks = [];
    response.on('data', function(chunk) {
        chunks.push(chunk);
    });
    response.on('end', function() {
        console.log('Response', Buffer.concat(chunks).toString());
    });
});

request.on('error', function(error) {
    console.log(error.message);
});

request.end();

基本上你不需要明确的代理支持。 代理协议非常简单,基于普通的 HTTP 协议。 您只需要在与 HTTPClient 连接时使用您的代理主机和端口。 示例(来自 node.js 文档):

var http = require('http');
var google = http.createClient(3128, 'your.proxy.host');
var request = google.request('GET', '/',
  {'host': 'www.google.com'});
request.end();
...

所以基本上你连接到你的代理,但请求“http://www.google.com”。

Node 应该支持使用 http_proxy 环境变量 - 所以它是跨平台的并且适用于系统设置,而不需要每个应用程序的配置。

使用提供的解决方案,我会推荐以下内容:

咖啡脚本

get_url = (url, response) ->
  if process.env.http_proxy?
    match = process.env.http_proxy.match /^(http:\/\/)?([^:\/]+)(:([0-9]+))?/i
    if match
      http.get { host: match[2], port: (if match[4]? then match[4] else 80), path: url }, response
      return
  http.get url, response

Javascript

get_url = function(url, response) {
  var match;
  if (process.env.http_proxy != null) {
    match = process.env.http_proxy.match(/^(http:\/\/)?([^:\/]+)(:([0-9]+))?/i);
    if (match) {
      http.get({
        host: match[2],
        port: (match[4] != null ? match[4] : 80),
        path: url
      }, response);
      return;
    }
  }
  return http.get(url, response);
};

用法要使用该方法,只需替换 http.get,例如以下将 google 的索引页写入名为 test.htm 的文件:

file = fs.createWriteStream path.resolve(__dirname, "test.htm")
get_url "http://www.google.com.au/", (response) ->
  response.pipe file
  response.on "end", ->
    console.log "complete"

我认为截至 2019 年的答案有更好的替代方案。我们可以使用global-tunnel-ng包来初始化代理,而不是到处污染基于httphttps的代码。 所以首先安装global-tunnel-ng包:

npm install global-tunnel-ng

然后根据需要更改您的实现以初始化代理:

const globalTunnel = require('global-tunnel-ng');

globalTunnel.initialize({
  host: 'proxy.host.name.or.ip',
  port: 8080
});

Imskull 的回答几乎对我有用,但我不得不做出一些改变。 唯一真正的变化是添加用户名、密码,并将rejectUnauthorized 设置为false。 我无法发表评论,所以我把它放在了一个答案中。

如果您运行代码,它会根据本教程为您提供 Hacker News 上当前故事的标题: http : //smalljs.org/package-managers/npm/

var cheerio = require('cheerio');
var request = require('request');

request({
    'url': 'https://news.ycombinator.com/',
    'proxy': 'http://Username:Password@YourProxy:Port/',
    'rejectUnauthorized': false
}, function(error, response, body) {
    if (!error && response.statusCode == 200) {
        if (response.body) {
            var $ = cheerio.load(response.body);
            $('td.title a').each(function() {
                console.log($(this).text());
            });
       }
    } else {
        console.log('Error or status not equal 200.');
    }
});

只需使用代理包装器运行 nodejs,例如tsocks tsocks node myscript.js

原解决方案: 在NodeJS中通过SOCKS5代理做http请求

更多信息: https : //www.binarytides.com/proxify-applications-with-tsocks-and-proxychains-on-ubuntu/

对于 Windows: https : //superuser.com/questions/319516/how-to-force-any-program-to-use-socks

可能不是您希望的确切单行程序,但您可以查看http://github.com/nodejitsu/node-http-proxy,因为这可能会阐明如何将您的应用程序与 http 一起使用。客户端。

为了使用带有 https 的代理,我尝试了本网站上的建议(使用依赖项https-proxy-agent ),它对我有用:

http://codingmiles.com/node-js-making-https-request-via-proxy/

http://groups.google.com/group/nodejs/browse_thread/thread/d5aadbcaa00c3f7/12ebf01d7ec415c3?lnk=gst&q=proxy#12ebf01d7ec415c3

根据该线程的答案,您似乎可以使用代理通过代理服务器运行 node.js:
$ proxychains /path/to/node application.js

我个人无法在Cygwin/Windows环境中安装任何代理链版本,因此无法对其进行测试。

此外,他们还谈到了使用连接代理,但我找不到任何有关如何执行此操作的文档。

简而言之,我仍然被困住了,但也许有人可以使用此信息来找到合适的解决方法。

像这样使用“https-proxy-agent”

var HttpsProxyAgent = require('https-proxy-agent');
var proxy = process.env.https_proxy || 'other proxy address';
var agent = new HttpsProxyAgent(proxy);

options = {
    //...
    agent : agent
}

https.get(options, (res)=>{...});

如果您有Basic http 身份验证方案,则必须创建一个 base64 字符串myuser:mypassword ,然后在开头添加“Basic”。 这是Proxy-Authorization标头的值,这里是一个示例:

var Http = require('http');

var req = Http.request({
    host: 'myproxy.com.zx',
    port: 8080,
    headers:{"Proxy-Authorization": "Basic bXl1c2VyOm15cGFzc3dvcmQ="},
    method: 'GET',
    path: 'http://www.google.com/'
    }, function (res) {
        res.on('data', function (data) {
        console.log(data.toString());
    });
});

req.end();

在 nodejs 中,您可以使用Buffer进行编码

var encodedData = Buffer.from('myuser:mypassword').toString('base64');

console.log(encodedData);

举个例子,在浏览器中,你可以使用btoa()在 base64 中编码,这在浏览器中的 ajax 请求中很有用,没有代理设置使用代理执行请求。

 var encodedData = btoa('myuser:mypassword') console.log(encodedData);

如何找到哪个方案接受代理服务器?

如果我们没有配置自定义 DNS(这会抛出类似 ERR_NAME_NOT_RESOLVED 之类的东西),当我们执行请求时,响应(代码 407)应该在响应头中通知代理正在使用哪个 http 身份验证方案。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM