[英]Crawling with “npm crawler”
例如,我要從npmjs.org抓取Node.js模塊的描述。
但是此代碼不起作用。 以及它是如何使用jQuery而不是jsdom模塊實現的。
var Crawler = require("crawler").Crawler;
var crawler = new Crawler({
"maxConnections":10,
});
crawler.queue([{
"uri":"https://npmjs.org/package/crawler",
"callback":function(error,result) {
console.log("description:", window.$("p.description").text());
}
}]);
您的代碼存在太早。 在最后一行添加setTimeout,以提供足夠的時間來完成代碼。
然后從您的回調函數調用process.exit()。
搜尋器回調函數需要3個參數,第3個參數是jQuery,因此您可能會使用如下所示的參數:
"callback":function(error,result,$) {
console.log("description:",$("p.description").text());
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.