[英]How can I use these Node modules to accept HTML through a file or URL and then output JSON as validation of existing HTML elements?
基本上我需要做的是獲取一個本地grader.js文件,然后在命令行使用它來輸入HTML,然后將輸出JSON數據到控制台以驗證是否存在多個HTML元素。 用法看起來像這樣:
./grader.js --checks checks.json --file index.html
./grader.js --checks checks.json --url http://google.com
使用的Node模塊是Commander(用於在命令行工作),Cheerio(用於HTML)和Restler(用於從URL獲取HTML)。
checks.json文件很簡單,因為它只是要求檢查是否存在一些簡單的HTML元素,以確定它們是否存在於頁面上:
["h1",
".navigation",
".logo",
".blank",
".about",
".heading",
".subheading",
".pitch",
".video",
".thermometer",
".order",
".social",
".section1",
".section2",
".faq",
".footer"]
grader.js文件是事情變得復雜的地方。 以下代碼實際上是有用的,因為它采用命令行參數,並指示HTML元素是否存在的true或false值。 但是在底部添加URL檢查后它無法正常工作。 我的checkURL函數和使用底部Commander代碼實現它的方式有問題。 即使真值和假值依賴於我使用的HTML文件/ URL是正確的,我最終也會將兩個檢查都吐出到控制台,即使我只想檢查文件或URL,而不是兩者。 我對此很新,所以我很驚訝它的功能完全正常。 它可能與默認值有關,但是當我嘗試進行這些更改時,checkURL函數似乎會崩潰。 在此先感謝您的幫助,我真的很感激。
#!/usr/bin/env node
var fs = require('fs');
var program = require('commander');
var cheerio = require('cheerio');
var rest = require('restler');
var HTMLFILE_DEFAULT = "index.html";
var CHECKSFILE_DEFAULT = "checks.json";
var URL_DEFAULT = "http://cryptic-spire-7925.herokuapp.com/index.html";
var assertFileExists = function(infile) {
var instr = infile.toString();
if(!fs.existsSync(instr)) {
console.log("%s does not exist. Exiting.", instr);
process.exit(1); // http://nodejs.org/api/process.html#process_process_exit_code
}
return instr;
};
var cheerioHtmlFile = function(htmlfile) {
return cheerio.load(fs.readFileSync(htmlfile));
};
var loadChecks = function(checksfile) {
return JSON.parse(fs.readFileSync(checksfile));
};
var checkHtmlFile = function(htmlfile, checksfile) {
$ = cheerioHtmlFile(htmlfile);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
return out;
};
var checkUrl = function(url, checksfile) {
rest.get(url).on('complete', function(data) {
$ = cheerio.load(data);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
console.log(out);
});
}
var clone = function(fn) {
// Workaround for commander.js issue.
// http://stackoverflow.com/a/6772648
return fn.bind({});
};
if(require.main == module) {
program
.option('-f, --file <html_file>', 'Path to index.html', clone(assertFileExists), HTMLFILE_DEFAULT)
.option('-u, --url <url>', 'URL to index.html', URL_DEFAULT)
.option('-c, --checks <check_file>', 'Path to checks.json', clone(assertFileExists), CHECKSFILE_DEFAULT)
.parse(process.argv);
var checkJson = checkHtmlFile(program.file, program.checks);
var outJson = JSON.stringify(checkJson, null, 4);
console.log(outJson);
var checkJson2 = checkUrl(program.url, program.checks);
var outJson2 = JSON.stringify(checkJson2, null, 4);
console.log(outJson2);
}
else {
exports.checkHtmlFile = checkHtmlFile;
}
根據參數調用checkHtmlFile()
或checkUrl()
就像是:
if (program.url)
checkUrl(program.url, program.checks);
else checkHtmlFile(program.file, program.checks);
閱讀本文以獲取更多參考: commander.js選項解析
另外, checkJson2
undefined
因為checkUrl()
沒有返回任何內容。
那些指揮官。選線對我來說是錯誤的。
刪除克隆功能並修改選項行,如下所示:
.option('-f, --file <html_file>', 'Path to index.html', HTMLFILE_DEFAULT)
.option('-u, --url <url>', 'URL to index.html', URL_DEFAULT)
.option('-c, --checks <check_file>', 'Path to checks.json', CHECKSFILE_DEFAULT)
這應該解決你的指揮官問題。
這是@David和@ankitsabharwal提供的有用提示后更新的checkUrl函數。
var checkUrl = function(url, checksfile) {
rest.get(url).on('complete', function(data) {
$ = cheerio.load(data);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
var outJson = JSON.stringify(out, null, 4);
console.log(outJson);
});
}
以下是更新后的Commander代碼:
if(require.main == module) {
program
.option('-f, --file <html_file>', 'Path to index.html')
.option('-u, --url <url>', 'URL to index.html')
.option('-c, --checks <check_file>', 'Path to checks.json')
.parse(process.argv);
if (program.url) {
checkUrl(program.url, program.checks);
} else {
checkHtmlFile (program.file, program.checks);
var checkJson = checkHtmlFile(program.file, program.checks);
var outJson = JSON.stringify(checkJson, null, 4);
console.log(outJson);
}
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.