簡體   English   中英

Jsoup 從 html 表中提取數據

[英]Jsoup to extract data from html table

我今天已經開始使用 JSoup 來用於 android 應用程序,所以我有這張表,我需要從中提取數據,但看起來,這將是艱難的。 需要一些幫助; 表中的 html 如下:

<TR BGCOLOR='#999999'>
      <TD ALIGN='left'><span class='S09W80'><font color=#DDDDDD>CODE</span></TD>
      <TD ALIGN='left'><span class='S09W80'><font color=#DDDDDD>SUBJECT NAME</span></TD>
      <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>PERIOD FROM</span></TD>
      <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>PERIOD TO</span></TD>
      <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>ENROL DATE</span></TD>
      <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>GRADE</span></TD>                
</TR>

隨后是重復的

<TR BGCOLOR='#FFFFFF'>
  <TD ALIGN='left'><span class='S09W50'>IT142</span></TD>
  <TD ALIGN='left'><span class='S09W50'>INTRODUCTION TO GRAPHICS DEVELOPMENT</span></TD>
  <TD ALIGN='right'><span class='S09W50'>21-FEB-11</span></TD>
  <TD ALIGN='right'><span class='S09W50'>17-JUN-11</span></TD>
  <TD ALIGN='right'><span class='S09W50'>22-FEB-11</span></TD>
  <TD ALIGN='center'><span class='S09W80'>B-</span></TD>
</TR>

但是我如何使用 doc.select (使用什么選擇器?); 這里?

不是真正的 Android 問題,而是 CSS 選擇器問題。 您可以在http://www.w3.org/TR/CSS2/selector.html了解更多信息

像這樣進行屏幕抓取總是很棘手,並且沒有“正確”的解決方案。

您將需要執行多個 select 步驟。

  1. 像“body > table > tr”這樣的選擇器。 取第一個元素。 這將為您提供初始 TR 元素。
  2. 驗證 TR 元素,獲取其子元素並驗證其中一個具有文本“SUBJECT NAME”。
  3. 然后可以依次處理其他TR元素。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM