提取文字之間 <p> 標簽，jsoup

Question

鑒於此HTML：

<html> 
   <head></head>
   <body>
      <p>
        "Text"
        <br>
        "Some more Text"
        <br> 
        "Even more text"
        </p>
  </body>
</html>

我正在嘗試使用§Elementdescription = document.select（______）`在<p>標記內獲取文本。 我如何獲得此文字？ 我可以使用沒有正文的頁面來完成此操作，但不確定如何通過正文標簽。 謝謝。

Answer 1

您可以使用選擇器： p提取所有<p>元素，並使用元素訪問器： text()從每個<p>元素中讀取文本。

這是使用問題中提供的HTML的示例：

@Test
public void canGetTextFromAPElement() {
    String html = "<html> \n" +
            "   <head></head>\n" +
            "   <body>\n" +
            "      <p>\n" +
            "        \"Text\"\n" +
            "        <br>\n" +
            "        \"Some more Text\"\n" +
            "        <br> \n" +
            "        \"Even more text\"\n" +
            "        </p>\n" +
            "  </body>\n" +
            "</html>";

    Document doc = Jsoup.parse(html);

    Elements elements = doc.select("p");

    assertThat(elements.size(), is(1));
    assertThat(elements.get(0).text(), is("\"Text\" \"Some more Text\" \"Even more text\""));
}

提取文字之間 <p> 標簽，jsoup

問題描述

1 個解決方案

解決方案1
0 已采納 2017-11-12 09:46:37

提取文字之間 <p> 標簽，jsoup

問題描述

1 個解決方案

解決方案1 0 已采納 2017-11-12 09:46:37

解決方案1
0 已采納 2017-11-12 09:46:37