簡體   English   中英

如何從沒有ID或Class的標簽中獲取文本

[英]How to get a text from a tag that do not have ID or Class

我想使用JSOUP從此片段中提取“電影”文本: 在此處輸入圖片說明

您會注意到,除了第一個跨度之外,第二個跨度標簽也沒有ID或類。 我的問題是如何檢索該文本?

謝謝。

<span>                                                             
</span><span><span class="contentTitle">
Program Type:</span>
<span style="font-size: 14px;">
Movie</span>
<br />
</span><span id="MainContent_trProgramCategories"><span class="contentTitle">
 Categories:</span>&nbsp; 
<span style="font-size: 14px;">Horror, Thriller
</span>

嘗試這個

Element element = doc.select("#MainContent_trProgramCategories  .contentTitle").get(0).nextElementSibling();

您需要通過使用select(...)方法來繼續減少數據消耗。 例如,只需做:

Elements myEles = doc.select("div[id=MainContent_UpdatePanel2] td");
String text = myEles.text();

System.out.println(text);

將為您提供您可能感興趣的大部分內容。

您可以使用“氣墊船充滿鰻魚”的建議。

不過,對於將來的用例,獲取元素的CSS路徑或XPath的最簡單方法是使用Firebug擴展。

Firebug擴展

您可以單擊“查找錯誤的圖像”旁邊的“查找鼠標指針的圖標”,然后選擇要從瀏覽器中檢索值的元素,然后下一行的XPath / CSS文本框將為您提供路徑采用。

只需復制該文本並將其粘貼到代碼中

doc.select("HERE PASTE THE XPATH/CSS PATH THAT YOU COPIED FROM FIREBUG").text();

如果您使用的是chrome,

您可以

  1. 右鍵單擊要從中檢索文本值的元素
  2. 選擇“檢查元素”
  3. 再次右鍵單擊調試器中突出顯示的元素
  4. 選擇“復制XPath”

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM