簡體   English   中英

從html字符串中刪除額外的“a href”標記

[英]Remove extra “a href” tag from html string

我有一個像這樣的html字符串:

 <a class="favourite" href="LixWQfueLU"><a href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a></a>

我想制作html字符串:

<a class="favourite" href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a>

我該如何解決上述問題? 我應該使用JSOUP還是Regex 解決方案是什么?

使用JSoup的代碼將以更通用的方式執行此操作:

    String html ="<a class=\"favourite\" href=\"LixWQfueLU\"><a href=\"LixWQfueLU\"><font color=\"#009a49\">Rohit Lalwani</font></a></a>";
    Document doc = Jsoup.parse(html);
    Element afav = doc.select(".favourite").first();
    Element select = doc.select("font").first();
    afav.remove();
    afav.appendChild(select);
    System.out.println(afav);

輸出:

<a class="favourite" href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a>

嘗試使用子字符串獲取所需的字符串:

String beforeString = "<p dir=\"ltr\"> <a class=\"favourite\" href=\"LixWQfueLU\"><a href=\"LixWQfueLU\"><font color=\"#009a49\">Rohit Lalwani</font></a></a></p>";

String afterString = beforeString.substring(0,beforeString.indexOf("<a href")+1)+beforeString.substring(beforeString.indexOf("<font"),beforeString.indexOf("</a>"))+beforeString.substring(beforeString.indexOf("</a>")+4,beforeString.length());

afterString的值:

<p dir="ltr"> <a class="favourite" href="LixWQfueLU"><<font color="#009a49">Rohit Lalwani</font></a></p>

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM