簡體   English   中英

使用Jsoup提取數據

[英]Using Jsoup to extract data

我正在使用jsoup從網站中的表中提取數據。 使用Jsoup http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=BSE&opttopic=topgainers&index=-1 我已經提到了使用JSoup提取HTML表內容和其他類似問題,但是它不打印數據。 有人可以向我提供實現此目標所需的代碼嗎?

public class TestClass
 {


public static void main(String args[]) throws IOException
{
Document doc = Jsoup.connect("http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=BSE&opttopic=topgainers&index=-1").get();

    for (Element table : doc.select("table.tablehead")) {
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }

如果要獲取表(而不是表頭)的內容 ,則需要更改表的選擇器:

for (Element table : doc.select("table.tbldata14"))

代替

 for (Element table : doc.select("table.tablehead"))

一件重要的事情是檢查您在解析HTML時在Doc中獲得了什么,因為它可能存在一些問題,例如:1.該網站可能正在使用iframe來顯示內容2.通過Javascript顯示內容3.很少有腳本的網站不允許jsoup解析,因此doc元素將包含隨機數據

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM