[英]Getting source of a page after it's rendered in a templating engine?
因此,我在JS非常繁重的网站上进行了一些屏幕抓取。 它使用呈现所有内容的客户端模板引擎。 我尝试使用jQuery,并且可以在控制台中使用,但显然不能在服务器(Nodejs)上使用。
我查看了一些用于Python和Java的库,它们似乎能够处理我想要的内容,但是我更喜欢与Node服务器配合使用的JS解决方案。
有什么方法可以使用Node获取呈现页面后的完整源代码吗?
var jsdom = require( 'jsdom' );
jsdom.env( {
url: <give_url_of_page_u_want_to_scarpe>,
scripts: [ "http://code.jquery.com/jquery.js" ],
done: function( error, window ) {
var $ = window.$;
// required page is loaded in $....
//you can write any javascript or jquery code get what ever you want
}
} );
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.