解析当前页面的html

Question

我想制作一个脚本来解析当前页面的html，过滤掉某些div类，现在将其内容写入文件或删除页面上除它们以外的所有内容。

我猜最好的方法是在该页面上运行Tampermonkey脚本。 我查看了http://userscripts-mirror.org/，但是找不到这样的脚本。

是否有可以在chrome上运行的javascript html解析器？

也许可以像这样工作吗？

 var divClasses = parseCurrentPage("div class x");
 // then do something on divClasses and then show only them

Answer 1

过滤掉某些div类

您可以使用document.getElementsByClassName()

 var elements = document.getElementsByClassName(names); // or: var elements = rootElement.getElementsByClassName(names); 
elements是找到的元素的实时HTMLCollection 。

names是一个字符串，表示要匹配的类名称列表； 类名用空格分隔

可以在任何元素上调用getElementsByClassName，不仅可以在文档上调用。 调用该元素的元素将用作搜索的根。

Answer 2

jQuery可以完成所有这些以及更多操作。 我建议阅读它https://learn.jquery.com/

一旦包含了jquery，就可以简单地抓住所有“ div”元素选择器，如下所示： var divClasses = $('div'); 如果您只想获取某些div元素，则可以使用选择器轻松完成此操作，方法是将类，id和/或父级/层次结构级别限制添加到选择器-在此处了解更多信息https://api.jquery.com/category /选择/

然后，在对div元素执行完您想做的事情之后，您可以再次使用jquery仅使用jquery的'append'函数显示它们。

使用要添加到父html元素$('selector-to-grap-div\\'s-parent-html').append(myDiv);的div元素简单调用“ append”函数$('selector-to-grap-div\\'s-parent-html').append(myDiv); 如果您需要获取div元素之一的父级，则可以使用jquery的“父级”功能

Answer 3

我相信您可以使用jQuery轻松实现...只需获取<body>的内容并使用jquery进行查询。

解析当前页面的html

问题描述

3 个解决方案

解决方案1
1 2016-09-23 19:25:28

解决方案2
1 已采纳 2016-09-23 19:25:33

解决方案3
0 2016-09-23 19:24:25

解析当前页面的html

问题描述

3 个解决方案

解决方案1 1 2016-09-23 19:25:28

解决方案2 1 已采纳 2016-09-23 19:25:33

解决方案3 0 2016-09-23 19:24:25

解决方案1
1 2016-09-23 19:25:28

解决方案2
1 已采纳 2016-09-23 19:25:33

解决方案3
0 2016-09-23 19:24:25