[英]How do I select a specific set of <p> tags with jsoup
我有以下我想解析的HTML代碼
任何人都可以告訴我如何只選擇框中的p標簽。 或者任何人都可以告訴我如何刪除紅線下方的標簽? 此外,還有大量不需要的p標簽
div class =“SPOSTARBUST-Related-Posts”
但
document.select("div.SPOSTARBUST-Related-Posts").remove();
好像什么也沒做
您應該使用以下選擇器
div[id=content] > p
像這樣
final String html = "<head><body/><div id=\"content\"><p>a</p><p>b</p><div><p>v</p></div></div></html>";
final Document doc = Jsoup.parse(html);
final Elements ps = doc.select("div[id=content] > p");
System.out.println(ps.size());
這將返回div[id="content"]
所有直接 p
子div[id="content"]
。
如果您只想在紅色框中選擇<p>
標簽,您可以看到唯一可以找到的標准是style="text-align: justify"
。
使用JSoup選擇器語法,您可以這樣做
Elements paragraphs = doc.select("p[style*=justify]");
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.