從Jsoup中的HTML文件提取文本信息

Question

在我編寫的一段代碼中，我需要從網頁上獲取一些信息。 該信息將取決於登錄的用戶。

我正在嘗試在下面的代碼中獲得標記為name和id number的兩條信息。

<tr> 
  <td align="right"><b><label for="name" id="lblname">Name:</label></b> &nbsp;</td> 
  <td>*name here*</td> 
  <td align="right"><b><label for="ident" id="lblident">Local ID</label>:</b> &nbsp;</td> 
  <td>*id number here*</td> 
</tr>

到目前為止，我能做到的最好的就是從下面的代碼中打印“元素”名稱。

Element name = information.getElementById("lblname");

它輸出的只是代碼的這一部分：

<label for="name" id="lblname">Name:</label>

我需要怎么做才能在HTML文件的此處定義名稱？

Answer 1

在獲取<tr> </tr>后，您可能使用正則表達式提取所需內容

Answer 2

您可以使用Jsoup的CSS選擇器語法提取所需的確切元素，例如：

// select the "name" <td>
Element name = doc.select("td:has(label#lblname) + td").first();

// select the "id" <td>
Element id = doc.select("td:has(label#lblident) + td").first();

// print out the text 
System.out.println(name.text());
System.out.println(id.text());

使用您的示例，輸出將是：

*name here*
*id number here*

從Jsoup中的HTML文件提取文本信息

問題描述

2 個解決方案

解決方案1
0 2015-03-08 11:37:14

解決方案2
0 2015-03-10 08:59:39

從Jsoup中的HTML文件提取文本信息

問題描述

2 個解決方案

解決方案1 0 2015-03-08 11:37:14

解決方案2 0 2015-03-10 08:59:39

解決方案1
0 2015-03-08 11:37:14

解決方案2
0 2015-03-10 08:59:39