如何從沒有ID或Class的標簽中獲取文本

Question

我想使用JSOUP從此片段中提取“電影”文本： 在此處輸入圖片說明

您會注意到，除了第一個跨度之外，第二個跨度標簽也沒有ID或類。 我的問題是如何檢索該文本？

謝謝。

<span>                                                             
</span><span><span class="contentTitle">
Program Type:</span>
<span style="font-size: 14px;">
Movie</span>
<br />
</span><span id="MainContent_trProgramCategories"><span class="contentTitle">
 Categories:</span>&nbsp; 
<span style="font-size: 14px;">Horror, Thriller
</span>

Answer 1

嘗試這個

Element element = doc.select("#MainContent_trProgramCategories  .contentTitle").get(0).nextElementSibling();

Answer 2

您需要通過使用select(...)方法來繼續減少數據消耗。 例如，只需做：

Elements myEles = doc.select("div[id=MainContent_UpdatePanel2] td");
String text = myEles.text();

System.out.println(text);

將為您提供您可能感興趣的大部分內容。

Answer 3

您可以使用“氣墊船充滿鰻魚”的建議。

不過，對於將來的用例，獲取元素的CSS路徑或XPath的最簡單方法是使用Firebug擴展。

Firebug擴展

您可以單擊“查找錯誤的圖像”旁邊的“查找鼠標指針的圖標”，然后選擇要從瀏覽器中檢索值的元素，然后下一行的XPath / CSS文本框將為您提供路徑采用。

只需復制該文本並將其粘貼到代碼中

doc.select("HERE PASTE THE XPATH/CSS PATH THAT YOU COPIED FROM FIREBUG").text();

如果您使用的是chrome，

您可以

右鍵單擊要從中檢索文本值的元素
選擇“檢查元素”
再次右鍵單擊調試器中突出顯示的元素
選擇“復制XPath”

如何從沒有ID或Class的標簽中獲取文本

問題描述

3 個解決方案

解決方案1
3 已采納 2013-08-13 09:29:26

解決方案2
2 2013-08-13 02:29:25

解決方案3
1 2013-08-13 09:48:52

如何從沒有ID或Class的標簽中獲取文本

問題描述

3 個解決方案

解決方案1 3 已采納 2013-08-13 09:29:26

解決方案2 2 2013-08-13 02:29:25

解決方案3 1 2013-08-13 09:48:52

解決方案1
3 已采納 2013-08-13 09:29:26

解決方案2
2 2013-08-13 02:29:25

解決方案3
1 2013-08-13 09:48:52