[英]Using Jsoup to extract data
我正在使用jsoup從網站中的表中提取數據。 使用Jsoup http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=BSE&opttopic=topgainers&index=-1 。 我已經提到了使用JSoup提取HTML表內容和其他類似問題,但是它不打印數據。 有人可以向我提供實現此目標所需的代碼嗎?
public class TestClass
{
public static void main(String args[]) throws IOException
{
Document doc = Jsoup.connect("http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=BSE&opttopic=topgainers&index=-1").get();
for (Element table : doc.select("table.tablehead")) {
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
if (tds.size() > 6) {
System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
}
}
}
如果要獲取表(而不是表頭)的內容 ,則需要更改表的選擇器:
for (Element table : doc.select("table.tbldata14"))
代替
for (Element table : doc.select("table.tablehead"))
一件重要的事情是檢查您在解析HTML時在Doc中獲得了什么,因為它可能存在一些問題,例如:1.該網站可能正在使用iframe來顯示內容2.通過Javascript顯示內容3.很少有腳本的網站不允許jsoup解析,因此doc元素將包含隨機數據
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.