繁体   English   中英

Java jsoup - 清除除链接之外的所有标记

[英]Java jsoup - clean all tags except link

输入字符串:

<b>Test link</b> <a href="https://www.w3schools.com">Visit W3Schools</a>

预期结果:

Test link <a href="https://www.w3schools.com">Visit W3Schools</a>

我尝试使用jsoup:

public String cleanHtml(String html)
    {
        Whitelist whitelist = Whitelist.none();
        whitelist.addTags("a");

        return Jsoup.clean(html, whitelist);
    }

结果是:

Test link <a>Visit W3Schools</a>

如何删除所有标签,但保持整个a href

您需要使用addAttributes 在这里你传递允许属性列表, whitelist.addAttributes("a","href","id","more") ;

试试这个:

String html = "<b>Test link</b> <a href=\"https://www.w3schools.com\">Visit W3Schools</a>";
    Whitelist whitelist = Whitelist.none();
    whitelist.addTags("a");
    whitelist.addAttributes("a","href");

    System.out.println(Jsoup.clean(html, whitelist));

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM