繁体   English   中英

使异步调用同步

[英]Make asynchronous calls synchronous

我曾经用PHP构建Web应用程序,因此习惯了同步执行操作。

我目前正在尝试构建网络抓取工具。 它的工作方式是

  1. 代理列表
  2. 检查代理是否有效
  3. 使用代理刮取Web内容。

但是,我已经意识到大多数调用都是同步的,并且我很难理解nodejs中的异步模块。

这是主要方法。

var proxyChecker = require('proxy-checker');
var request = require('request');
var forEach = require('async-foreach').forEach;
var async = require('async');

var proxiesJar = [];
var goodProxies = [];
var proxyCount = 0;    
parseProxiesList(function(error) {
        async.each(proxiesJar, checker, function(err, result) {
            console.log('Result:' + err);
        });
    });

获取代理列表

function parseProxiesList(callback) {
    console.log("parseProxiesList");
    request('http://hidden.com', function (error, response, body) {
        if (error) {
            console.log("Error [1]");
            return callback(error);
        }
        console.log("Got proxies list");
        if (!error && response.statusCode == 200) {
            proxies = body.split(/\r?\n/);
            var shouldBreak = false;

            for (var i = 0; i < proxies.length; i++) {
                if (/[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\:[0-9]{1,5}/.test(proxies[i])) {
                    p = proxies[i].split(' ');
                    var elts = p[0].split(':');
                    var host = elts[0];
                    var port = elts[1];
                    proxiesJar.push(host + ":" + port);
                }
            }
            callback(null, 1);
        }
    });
}

获取代理列表后,它将检查代理是否正常工作。

var checker = function(proxy, callback) {
    var p = proxy.split(':');
    var host = p[0];
    var port = p[1];
    console.log('[Checking] ' + host + ':' + port);
    proxyChecker.checkProxy(host, port, {url: 'http://google.com',regex: /Google/}, function(host, port, ok, statusCode, err) {

        if(!ok) {
            console.log("Proxy don't work: " + host + ":" + port);
            return callback(err);
        } else {
            console.log("Working proxy: " + host + ":" + port);
            goodProxies.push(host + ":" + port);
            return callback(null, host + ":" + port);
        }
    });
};

日志,但是,事实证明是

[Checking] 1.1.1.1:80
[Checking] 2.2.2.2:80
.
.
.
Working proxy: 1.1.1.1:80
Working proxy: 2.2.2.2:80

代替

[Checking] 1.1.1.1:80
Working proxy: 1.1.1.1:80

[Checking] 2.2.2.2:80
Working proxy: 2.2.2.2:80

async.each为每个项目并行执行迭代器。

使用async.eachSeries进行同步调用。

您可以尝试promise,创建promise以获取代理,然后执行promise检查它。

您可以在这里找到更多关于诺言的信息

例:

function parseProxiesList() {
    var deferred = Q.defer()
    console.log("parseProxiesList");
    request('http://hidden.com', function (error, response, body) {
        if (error) {
            console.log("Error [1]");
            deferred.reject(error);
        }
        console.log("Got proxies list");
        if (!error && response.statusCode == 200) {
            proxies = body.split(/\r?\n/);
            var shouldBreak = false;

            for (var i = 0; i < proxies.length; i++) {
                if (/[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\:[0-9]{1,5}/.test(proxies[i])) {
                    p = proxies[i].split(' ');
                    var elts = p[0].split(':');
                    var host = elts[0];
                    var port = elts[1];
                    proxiesJar.push(host + ":" + port);
                }
            }
            deffered.resolve(proxiesJar);
        }
        return deffered.promise;
    });
}

这样,您就创建了一个获得代理列表的承诺。 同样,您可以执行此操作以检查代理。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM