簡體   English   中英

如何選擇一組特定的 <p> 標簽與jsoup

[英]How do I select a specific set of <p> tags with jsoup

我有以下我想解析的HTML代碼 截圖

任何人都可以告訴我如何只選擇框中的p標簽。 或者任何人都可以告訴我如何刪除紅線下方的標簽? 此外,還有大量不需要的p標簽

div class =“SPOSTARBUST-Related-Posts”

document.select("div.SPOSTARBUST-Related-Posts").remove();

好像什么也沒做

您應該使用以下選擇器

div[id=content] > p

像這樣

    final String html = "<head><body/><div id=\"content\"><p>a</p><p>b</p><div><p>v</p></div></div></html>";
    final Document doc = Jsoup.parse(html);

    final Elements ps = doc.select("div[id=content] > p");
    System.out.println(ps.size());

這將返回div[id="content"]所有直接 pdiv[id="content"]

如果您只想在紅色框中選擇<p>標簽,您可以看到唯一可以找到的標准是style="text-align: justify"

使用JSoup選擇器語法,您可以這樣做

Elements paragraphs = doc.select("p[style*=justify]");

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM