[英]How to get text from this html tag by using jsoup?
當我使用jsoup提取數據時,我遇到了一個位置。 這樣的數據:
This is a <strong>strong</strong> number <date>2013</date>
我想得到這樣的數據: This is a number
我怎樣才能做到這一點? 誰能幫我?
您可以將html解析為Document
,選擇body
-Element並獲取其文本。
例:
Document doc = Jsoup.parse("This is a <strong>strong</strong> number <date>2013</date>");
String ownText = doc.body().ownText();
String text = doc.body().text();
System.out.println(ownText);
System.out.println(text);
輸出:
This is a number
This is a strong number 2013
這應該回答你的問題:
public String escapeHtml(String source) {
Document doc = Jsoup.parseBodyFragment(source);
Elements elements = doc.select("b");
for (Element element : elements) {
element.replaceWith(new TextNode(element.toString(),""));
}
return Jsoup.clean(doc.body().toString(), new Whitelist().addTags("a").addAttributes("a", "href", "name", "rel", "target"));
}
Document doc = Jsoup.parse("This is a <strong>strong</strong> number <date>2013</date>");
Spanned HtmlDoc = Html.fromHtml(doc.toString());
String fromHTML = HtmlDoc.toString();
System.out.println(fromHTML);
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.