[英]Extracting text between <p> tags, jsoup
鑒於此HTML:
<html>
<head></head>
<body>
<p>
"Text"
<br>
"Some more Text"
<br>
"Even more text"
</p>
</body>
</html>
我正在嘗試使用§Elementdescription = document.select(______)`在<p>
標記內獲取文本。 我如何獲得此文字? 我可以使用沒有正文的頁面來完成此操作,但不確定如何通過正文標簽。 謝謝。
您可以使用選擇器: p
提取所有<p>
元素,並使用元素訪問器: text()
從每個<p>
元素中讀取文本。
這是使用問題中提供的HTML的示例:
@Test
public void canGetTextFromAPElement() {
String html = "<html> \n" +
" <head></head>\n" +
" <body>\n" +
" <p>\n" +
" \"Text\"\n" +
" <br>\n" +
" \"Some more Text\"\n" +
" <br> \n" +
" \"Even more text\"\n" +
" </p>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
Elements elements = doc.select("p");
assertThat(elements.size(), is(1));
assertThat(elements.get(0).text(), is("\"Text\" \"Some more Text\" \"Even more text\""));
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.