繁体   English   中英

如何使用Rhino移除 <scripts> 标签?

[英]How do I use Rhino to remove <scripts> tag?

我有使用Jsoup解析的HTML电子邮件:-

Jsoup.parse(bizmsg.getMessageBody()).text()

但是它不能删除脚本标签:

<script>
document.write("Bazinga!")
</script>

我一直在这样使用正则表达式:-

String(v).replace(/(?:<script.*?>)((\n|\r|.)*?)(?:<\/script>)/ig, "");

成功删除脚本。 但是我遇到了这个问题JSoup来解析<script>标签

如何使用Rhino解析脚本? 代码示例将非常有帮助,谢谢。

您不需要使用Rhino删除<script>标签。 在JSoup中使用简单的CSS选择器并删除获得的节点。 这是www.google.com上的一个最小示例

public static void main(String[] args) throws MalformedURLException, IOException {
    Document doc = Jsoup.parse(new URL("http://www.google.com"),5000);
    Elements elems = doc.select("script");
    for (Element elem : elems)
        elem.remove();
    System.out.println(doc);

}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM