繁体   English   中英

解析当前页面的html

[英]Parse html of current page

我想制作一个脚本来解析当前页面的html,过滤掉某些div类,现在将其内容写入文件或删除页面上除它们以外的所有内容。

我猜最好的方法是在该页面上运行Tampermonkey脚本。 我查看了http://userscripts-mirror.org/,但是找不到这样的脚本。

是否有可以在chrome上运行的javascript html解析器?

也许可以像这样工作吗?

 var divClasses = parseCurrentPage("div class x");
 // then do something on divClasses and then show only them

过滤掉某些div类

您可以使用document.getElementsByClassName()

 var elements = document.getElementsByClassName(names); // or: var elements = rootElement.getElementsByClassName(names); 
  • elements是找到的元素的实时HTMLCollection
  • names是一个字符串,表示要匹配的类名称列表; 类名用空格分隔
  • 可以在任何元素上调用getElementsByClassName,不仅可以在文档上调用。 调用该元素的元素将用作搜索的根。

jQuery可以完成所有这些以及更多操作。 我建议阅读它https://learn.jquery.com/

一旦包含了jquery,就可以简单地抓住所有“ div”元素选择器,如下所示: var divClasses = $('div'); 如果您只想获取某些div元素,则可以使用选择器轻松完成此操作,方法是将类,id和/或父级/层次结构级别限制添加到选择器-在此处了解更多信息https://api.jquery.com/category /选择/

然后,在对div元素执行完您想做的事情之后,您可以再次使用jquery仅使用jquery的'append'函数显示它们。

使用要添加到父html元素$('selector-to-grap-div\\'s-parent-html').append(myDiv);的div元素简单调用“ append”函数$('selector-to-grap-div\\'s-parent-html').append(myDiv); 如果您需要获取div元素之一的父级,则可以使用jquery的“父级”功能

我相信您可以使用jQuery轻松实现...只需获取<body>的内容并使用jquery进行查询。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM