[英]Remove extra “a href” tag from html string
我有一個像這樣的html字符串:
<a class="favourite" href="LixWQfueLU"><a href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a></a>
我想制作html字符串:
<a class="favourite" href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a>
我該如何解決上述問題? 我應該使用JSOUP還是Regex ? 解決方案是什么?
使用JSoup的代碼將以更通用的方式執行此操作:
String html ="<a class=\"favourite\" href=\"LixWQfueLU\"><a href=\"LixWQfueLU\"><font color=\"#009a49\">Rohit Lalwani</font></a></a>";
Document doc = Jsoup.parse(html);
Element afav = doc.select(".favourite").first();
Element select = doc.select("font").first();
afav.remove();
afav.appendChild(select);
System.out.println(afav);
輸出:
<a class="favourite" href="LixWQfueLU"><font color="#009a49">Rohit Lalwani</font></a>
嘗試使用子字符串獲取所需的字符串:
String beforeString = "<p dir=\"ltr\"> <a class=\"favourite\" href=\"LixWQfueLU\"><a href=\"LixWQfueLU\"><font color=\"#009a49\">Rohit Lalwani</font></a></a></p>";
String afterString = beforeString.substring(0,beforeString.indexOf("<a href")+1)+beforeString.substring(beforeString.indexOf("<font"),beforeString.indexOf("</a>"))+beforeString.substring(beforeString.indexOf("</a>")+4,beforeString.length());
afterString的值:
<p dir="ltr"> <a class="favourite" href="LixWQfueLU"><<font color="#009a49">Rohit Lalwani</font></a></p>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.