[英]How to extract particular ownText JSOUP
String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""
String linkOuterH = link.outerHtml();
// "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"
在此示例中,我只想提取“ An”,“ link”等。 例如,我想在节点“ An”之前和节点“ link”之后获取文本。 在上面的例子中
要获取该段落的文本,请选择它并询问其自己的文本:
Element p = doc.select("p").first();
System.out.println(p.ownText());
如果需要构成文本的部分,则可以遍历该元素的子节点,并仅选择那些是TextNode实例的子节点:
for (Node node :p.childNodes()){
if (node instanceof TextNode){
System.out.println(((TextNode)node).text());
}
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.