jSoup使用td類標簽從網頁獲取數據

Question

我想使用jSoup從http://www.futbol24.com/Live/?__igp=1&LiveDate=20141104獲取數據。 我知道如何使用jSoup-但我發現很難查明所需的數據。

我希望tbody表格的每一行都有時間，主隊和客隊。 因此，第一行的輸出應為：

08:30     Persipura Jayapura      Pelita Bandung Raya

我可以將每個元素的td類視為“狀態alt”，“家庭”和“來賓”。

目前，我已經嘗試了以下方法，但似乎沒有輸出任何內容...我在做什么錯？

        matches = new ArrayList<Match>();

             //getHistory
            String website = "http://www.futbol24.com/Live/?__igp=1&LiveDate=20141104";
            Document doc = Jsoup.connect(website).get();

            Element tblHeader = doc.select("tbody").first();
            List<Match> data = new ArrayList<>();
            for (Element element1 : tblHeader.children()){

                Match match = new Match();
                match.setTimeOfMatch(element1.select("td.status.alt").text());
                match.setAwayTeam(element1.select("td.home").text());
                match.setHomeTeam(element1.select("td.guest").text());

                data.add(match);
                System.out.println(data.toString());

有人知道如何使用jSoup從表的每一行獲取這些元素嗎？

謝謝，

搶

Answer 1

該站點的內容似乎是通過AJAX生成的。 Jsoup無法處理此問題，因為它不是解釋JavaScript的瀏覽器。 要解決此抓取問題，您可能需要Selenium webdriver之類的東西。 在此之前，我對這個一般性問題給出了更長的答案，所以請在這里查看：

Jsoup獲取動態生成的HTML

jSoup使用td類標簽從網頁獲取數據

問題描述

1 個解決方案

解決方案1
1 已采納 2014-11-04 18:07:02

jSoup使用td類標簽從網頁獲取數據

問題描述

1 個解決方案

解決方案1 1 已采納 2014-11-04 18:07:02

解決方案1
1 已采納 2014-11-04 18:07:02