繁体 English 中英

JS改变DOM后如何刮掉一些东西？

[英]How do I scrape something after JS has changed the DOM?

原文 2012-05-15 21:36:18 3 4 javascript/ ruby/ screen-scraping/ nokogiri/ mechanize

我正在使用Mechanize，虽然如果Mechanize不能这样做，我会对Nokogiri开放。

我想在加载所有脚本之后将页面刮掉，而不是事先加载。

我怎么能这样做？

4 个解决方案

我认为Nokogiri，Watir和PhantomJs是一个很好的选择：

b = Watir::Browser.new(:phantomjs)

b.goto URL

doc = Nokogiri::HTML(b.html)

生成的文档将从脚本加载后的时间开始。 而phantomjs很不错，因为不需要加载浏览器。

Nokogiri和Mechanize不是完整的Web浏览器，也不在浏览器模型DOM中运行JavaScript。 您想使用Watir或Selenium之类的东西，它允许您使用Ruby来控制实际的Web浏览器。

除了watir-webdriver和capybara-webkit之外，快速是一个很好的选择，虽然它只是jruby。

我对机械化或nokogiri一无所知，所以我不能专门评论它们。 但是，在修改JavaScript之后获取JavaScript的问题是我认为只能通过更多JavaScript来解决的问题。 为了获得新生成的HTML，您需要获取文档元素的.innerHTML。 这可能很棘手，因为您必须将js注入页面。

我知道要做到这一点的唯一方法是编写一个FireFox插件。 使用插件，您可以在页面上运行JavaScript，即使它不是您的页面。 对不起，我没有更多的帮助，我希望这有助于让你走上正确的道路。

如果您对插件感兴趣，这是一个可以开始的地方：http：//anthonystechblog.wordpress.com/category/internet/firefox/

如何在js更改之后获取html

[英]how do I get the html after js has changed it

Redux 状态改变后怎么办？

[英]How to do something after Redux state changed?

在jQuery中，如何在事件完成后执行某些操作

[英]In jQuery how do I do something after an event has completed

如何在DOM更改后检查元素是否为空？

[英]How to check if element is empty after the DOM has changed?

在onload JS DOM注入后抓取页面

[英]Scrape page after onload JS DOM injection

JavaScript DOM：我如何告诉 JS 根据 json 数组中的值创建元素（'p'）？

[英]JavaScript DOM: How do I tell JS to createElement('p') that says something according to the value in a json array?

在DOM准备好但在呈现UI之前，如何使用jquery做些什么？

[英]How to do something with jquery after the DOM is ready but before the UI is rendered?

在$ .load（更改DOM后初始化插件

[英]Initialize Plugin after $.load( has changed the DOM

在 API 调用返回后，Node.js 会做一些事情

[英]Node.js do something after API call has returned

如果div颜色更改了3秒钟，请执行一些操作

[英]If a div color has changed for 3 seconds, do something

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在js更改之后获取html Redux 状态改变后怎么办？在jQuery中，如何在事件完成后执行某些操作如何在DOM更改后检查元素是否为空？在onload JS DOM注入后抓取页面 JavaScript DOM：我如何告诉 JS 根据 json 数组中的值创建元素（'p'）？在DOM准备好但在呈现UI之前，如何使用jquery做些什么？在$ .load（更改DOM后初始化插件在 API 调用返回后，Node.js 会做一些事情如果div颜色更改了3秒钟，请执行一些操作

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM