[英]Parse html of current page
我想制作一个脚本来解析当前页面的html,过滤掉某些div类,现在将其内容写入文件或删除页面上除它们以外的所有内容。
我猜最好的方法是在该页面上运行Tampermonkey脚本。 我查看了http://userscripts-mirror.org/,但是找不到这样的脚本。
是否有可以在chrome上运行的javascript html解析器?
也许可以像这样工作吗?
var divClasses = parseCurrentPage("div class x");
// then do something on divClasses and then show only them
过滤掉某些div类
您可以使用document.getElementsByClassName()
var elements = document.getElementsByClassName(names); // or: var elements = rootElement.getElementsByClassName(names);
- elements是找到的元素的实时
HTMLCollection
。- names是一个字符串,表示要匹配的类名称列表; 类名用空格分隔
- 可以在任何元素上调用getElementsByClassName,不仅可以在文档上调用。 调用该元素的元素将用作搜索的根。
jQuery可以完成所有这些以及更多操作。 我建议阅读它https://learn.jquery.com/
一旦包含了jquery,就可以简单地抓住所有“ div”元素选择器,如下所示: var divClasses = $('div');
如果您只想获取某些div元素,则可以使用选择器轻松完成此操作,方法是将类,id和/或父级/层次结构级别限制添加到选择器-在此处了解更多信息https://api.jquery.com/category /选择/
然后,在对div元素执行完您想做的事情之后,您可以再次使用jquery仅使用jquery的'append'函数显示它们。
使用要添加到父html元素$('selector-to-grap-div\\'s-parent-html').append(myDiv);
的div元素简单调用“ append”函数$('selector-to-grap-div\\'s-parent-html').append(myDiv);
如果您需要获取div元素之一的父级,则可以使用jquery的“父级”功能
我相信您可以使用jQuery轻松实现...只需获取<body>
的内容并使用jquery进行查询。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.