[英]Crawling with “npm crawler”
例如,我要从npmjs.org抓取Node.js模块的描述。
但是此代码不起作用。 以及它是如何使用jQuery而不是jsdom模块实现的。
var Crawler = require("crawler").Crawler;
var crawler = new Crawler({
"maxConnections":10,
});
crawler.queue([{
"uri":"https://npmjs.org/package/crawler",
"callback":function(error,result) {
console.log("description:", window.$("p.description").text());
}
}]);
您的代码存在太早。 在最后一行添加setTimeout,以提供足够的时间来完成代码。
然后从您的回调函数调用process.exit()。
搜寻器回调函数需要3个参数,第3个参数是jQuery,因此您可能会使用如下所示的参数:
"callback":function(error,result,$) {
console.log("description:",$("p.description").text());
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.