[英]Getting “compiled” HTML-page using Jsoup
頁面源代碼如下所示:
<td class="ftd">${row.time}</td>
<td class="mntd">${$item.getMTitle(row.movieId)}</td>
<td class="hntd" style="width:75px">${row.hall}</td>
<td class="ptd">${row.price}</td>
<td class="btd"><img class="butres" src="/image.png" alt=""/></td>
瀏覽器網絡檢查器中的最終代碼如下所示:
<td class="ftd">Item1</td>
<td class="mntd">Item2</td>
<td class="hntd" style="width:75px">Item3</td>
<td class="ptd">Item4</td>
<td class="btd"><img class="butres" src="/image.png" alt=""></td>
我正在嘗試解析網頁:
Document doc = Jsoup.connect("http://domain.com/").timeout(0).get();
但是它僅獲取源代碼。 如何獲得“已編譯”代碼?
謝謝。
如果您給我們提供了URL,它將更容易獲得幫助。 jsoup不執行JS(它是HTML解析器),這就是為什么您看不到數據的原因。 我的猜測是,數據將以mustache.js為模板從ajax請求以json形式傳入。
您可以使用瀏覽器的網絡監視器或諸如Charles的代理,通過加載頁面並查看網絡請求來確定此情況。 然后,您可以使用jsoup或其他工具來獲取數據URL,並使用json解析器對其進行解析。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.