繁体   English   中英

使用NodeJS抓取网站的javascript变量

[英]Scrape a websites's javascript variables using NodeJS

我正在尝试使用NodeJS应用程序刮擦网站变量的实时值。

我已经尝试过“ cheerio”,但没有成功。 它仅以字符串形式返回目标的HTML,而不是变量的运行时值。

例如,“ www.google.com”的“ google.authuser”的值

屏幕截图

请给我建议一个简单的解决方案。 谢谢。

感谢Headless浏览器的建议。 无头的Chrome NodeJS API Puppeteer为我工作。

async function crawl() {
const puppeteer = require('puppeteer');
const browser = await puppeteer.launch();

const page = await browser.newPage();
await page.goto('http://www.google.com');

const dataPromise = await page.evaluate(() => {
    return Promise.resolve({
        number: google.authuser
    });
});

browser.close();
return dataPromise;}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM