如何使用木偶，無頭鉻阻止廣告

Question

我正在尋找在node.js中使用偽造者（無頭鉻）時阻止廣告的任何方式，並且我在https://groups.google.com/a/chromium.org/forum/#!msg/headless中找到了這種方法-dev / G1u6SGeq7nw / VaIcIPlCAQAJ ;

 //http://winhelp2002.mvps.org/hosts.txt //For puppeteer I read in this host file: //now we read the host file var hostFile = fs.readFileSync('hosts.txt', 'utf8').split('\\n'); var hosts = {}; for (var i = 0; i < hostFile.length; i++) { var frags = hostFile[i].split(' '); if (frags.length > 1 && frags[0] === '0.0.0.0') { hosts[frags[1].trim()] = true; } } //When loading a page I then filter out requests for these domains (and optionally images): page.on('request', request => { var domain = null; if (task.input.blockads) { var frags = request.url().split('/'); if (frags.length > 2) { domain = frags[2]; } } if ((task.input.blockads && hosts[domain] === true) || (!task.input.includephotos && request.resourceType() === 'image')) { request.abort(); } else { request.continue(); } }); //This solution hugely improved the speed of our scraper.

但是我不知道這部分。 task.input.blockads這什么都不是，我一無所知。 任何想法？

Answer 1

這只是啟用/禁用檢查主機文件的參數。 如果您一直想要檢查，則忽略該部分

page.on('request', request => {

    var domain = null;
    var frags = request.url().split('/');
    if (frags.length > 2) {
       domain = frags[2];
    }

    // just abort if found
    if (hosts[domain] === true) {
        request.abort();
    } else {
        request.continue();
    }
});

如何使用木偶，無頭鉻阻止廣告

問題描述

我正在尋找在node.js中使用偽造者（無頭鉻）時阻止廣告的任何方式，並且我在https://groups.google.com/a/chromium.org/forum/#!msg/headless中找到了這種方法-dev / G1u6SGeq7nw / VaIcIPlCAQAJ ;

1 個解決方案

解決方案1
0 2018-12-17 00:06:50

如何使用木偶，無頭鉻阻止廣告

問題描述

我正在尋找在node.js中使用偽造者（無頭鉻）時阻止廣告的任何方式，並且我在https://groups.google.com/a/chromium.org/forum/#!msg/headless中找到了這種方法-dev / G1u6SGeq7nw / VaIcIPlCAQAJ ;

1 個解決方案

解決方案1 0 2018-12-17 00:06:50

解決方案1
0 2018-12-17 00:06:50