簡體   English   中英

使用Jsoup獲取“已編譯” HTML頁面

[英]Getting “compiled” HTML-page using Jsoup

頁面源代碼如下所示:

<td class="ftd">${row.time}</td>
<td class="mntd">${$item.getMTitle(row.movieId)}</td>
<td class="hntd" style="width:75px">${row.hall}</td>
<td class="ptd">${row.price}</td>
<td class="btd"><img class="butres" src="/image.png" alt=""/></td>

瀏覽器網絡檢查器中的最終代碼如下所示:

<td class="ftd">Item1</td>
<td class="mntd">Item2</td>
<td class="hntd" style="width:75px">Item3</td>
<td class="ptd">Item4</td>
<td class="btd"><img class="butres" src="/image.png" alt=""></td>

我正在嘗試解析網頁:

Document doc = Jsoup.connect("http://domain.com/").timeout(0).get();

但是它僅獲取源代碼。 如何獲得“已編譯”代碼?

謝謝。

如果您給我們提供了URL,它將更容易獲得幫助。 jsoup不執行JS(它是HTML解析器),這就是為什么您看不到數據的原因。 我的猜測是,數據將以mustache.js為模板從ajax請求以json形式傳入。

您可以使用瀏覽器的網絡監視器或諸如Charles的代理,通過加載頁面並查看網絡請求來確定此情況。 然后,您可以使用jsoup或其他工具來獲取數據URL,並使用json解析器對其進行解析。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM