簡體   English   中英

如何獲取Jsoup的屬性內容?

[英]How to get attribute content Jsoup?

我有

 <meta itemprop="datePublished" content="2015-01-26 12:37:00">

我想選擇內容 我嘗試沒有成功:

Document doc = Jsoup.connect("http://www.somesite.com/index.html").get();
Element link= doc.select("meta").first(); 
String contetn= link.attr("content");

但是在我的html中,我有:

<div style="overflow: visible;" itemscope="" itemtype="http://schema.org/Article">
<meta itemprop="url" content="http://www.somesite.com/index.html">
<meta itemprop="headline" content="some text">
<meta itemprop="datePublished" content="2015-01-26 12:37:00">
<meta itemprop="dateModified" content="2015-01-26 14:03:16">

您會看到我搜索了3-td標簽元數據,但無法選擇它。

Element link= doc.select("meta").first(); 

這將僅選擇找到的第一個meta元素。 由於第二個html中包含多個,因此您將得到錯誤的結果。

但這是一個例子

final String html = "<div style=\"overflow: visible;\" itemscope=\"\" itemtype=\"http://schema.org/Article\">\n"
        + "<meta itemprop=\"url\" content=\"http://www.somesite.com/index.html\">\n"
        + "<meta itemprop=\"headline\" content=\"some text\">\n"
        + "<meta itemprop=\"datePublished\" content=\"2015-01-26 12:37:00\">\n"
        + "<meta itemprop=\"dateModified\" content=\"2015-01-26 14:03:16\">";

Document doc = Jsoup.parse(html);

Element meta = doc.select("meta[itemprop=datePublished]").first();
String content = meta.attr("content");

System.out.println(content);

輸出: 2015-01-26 12:37:00

這將選擇所有具有屬性itemprop和屬性值datePublished meta元素。 從所有找到的,只采取第一個。 最后,您可以從單個元素獲取content -attribute的值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM