繁体   English   中英

提取 <data-id > 从HTML与JSoup

[英]Extract <data-id > from HTML with JSoup

我是Jsoup的新手,我正尝试使用Jsoup从网站上抓取一些数据。 我只想提取特定<data-id>节点下的<data-id> 这是网页结构

<tr data-id="13">
  <td class="th">Dimension</td>
  <td class="l">152.5x82x9.8mm (6x3.23x0.39")</td>
</tr>
<tr class="even" data-id="15">
  <td class="th">Weight</td>
  <td class="l">190gr (6.7oz)</td>
</tr>
<tr class="h" data-id="116">
   <td class="th">Ringtone</td>
   <td class="l"></td>
</tr>

我需要得到这样的东西

  1. 尺寸
  2. 190克
  3. 铃声请帮助我。

这就是我尝试过的

 public static void main(String[] args) throws Exception{

    final Document document =  Jsoup.connect("url").get();

    String testString = document.select("table")
            .select("tbody").select(".even")
            .select("td.l").text();
    System.out.println("the tile is "+testString);
    }
}

这是输出:152.5x82x9.8mm(6x3.23x0.39“)190gr,依此类推

    Document out = Jsoup.connect("https://www.phonegg.com/phone/9858-Energizer-Power-Max-P600s-32GB/%22")
            .timeout(15000).get();
    String dimension = out.getElementsByAttributeValue("data-id", "13").get(0).getElementsByClass("l").text();
    String weight = out.getElementsByAttributeValue("data-id", "15").get(0).getElementsByClass("l").text();
    String rington = out.getElementsByAttributeValue("data-id", "116").get(0).getElementsByClass("l").text();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM