簡體   English   中英

如何提取特定的ownText JSOUP

[英]How to extract particular ownText JSOUP

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();

String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"

在此示例中,我只想提取“ An”,“ link”等。 例如,我想在節點“ An”之前和節點“ link”之后獲取文本。 在上面的例子中

要獲取該段落的文本,請選擇它並詢問其自己的文本:

Element p = doc.select("p").first();
System.out.println(p.ownText());

如果需要構成文本的部分,則可以遍歷該元素的子節點,並僅選擇那些是TextNode實例的子節點:

for (Node node :p.childNodes()){
    if (node instanceof TextNode){
        System.out.println(((TextNode)node).text()); 
    }
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM