繁体   English   中英

我想创建一个 webscraper,它将从 angular 网站抓取 html

[英]I want to create a webscraper that will scrape html from angular website

我正在开发一个可以从有角度的网站上抓取的网络抓取工具。

我为此目的使用 HttpClient 类,但不是在页面的 body 标记中获取 html 标记,而是获取<ng-view> </ng-view>标记。 谁能解释发生了什么,我怎样才能得到 HTML 代码而不是ng-view标签?

据我所知,这是不可能的。 您所能“抓取”的只是提供给浏览器的初始标记。 所有其他内容都将通过运行 JavaScript 获取,该 JavaScript 会回调服务器以获取其他数据。

除非您准备编写一个完整的、功能齐全的 JavaScript 引擎,否则我会说初始页面就是您所获得的全部内容。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM