[英]jSoup get data using td-class tags from webpage
我想使用jSoup從http://www.futbol24.com/Live/?__igp=1&LiveDate=20141104獲取數據。 我知道如何使用jSoup-但我發現很難查明所需的數據。
我希望tbody表格的每一行都有時間,主隊和客隊。 因此,第一行的輸出應為:
08:30 Persipura Jayapura Pelita Bandung Raya
我可以將每個元素的td類視為“狀態alt”,“家庭”和“來賓”。
目前,我已經嘗試了以下方法,但似乎沒有輸出任何內容...我在做什么錯?
matches = new ArrayList<Match>();
//getHistory
String website = "http://www.futbol24.com/Live/?__igp=1&LiveDate=20141104";
Document doc = Jsoup.connect(website).get();
Element tblHeader = doc.select("tbody").first();
List<Match> data = new ArrayList<>();
for (Element element1 : tblHeader.children()){
Match match = new Match();
match.setTimeOfMatch(element1.select("td.status.alt").text());
match.setAwayTeam(element1.select("td.home").text());
match.setHomeTeam(element1.select("td.guest").text());
data.add(match);
System.out.println(data.toString());
有人知道如何使用jSoup從表的每一行獲取這些元素嗎?
謝謝,
搶
該站點的內容似乎是通過AJAX生成的。 Jsoup無法處理此問題,因為它不是解釋JavaScript的瀏覽器。 要解決此抓取問題,您可能需要Selenium webdriver之類的東西。 在此之前,我對這個一般性問題給出了更長的答案,所以請在這里查看:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.