簡體   English   中英

解析html,源代碼,javascript問題

[英]parsing html, source code, javascript problem

http://booking.travel24.com/index.php?KID=610000&&id=lmpergebnis&showresult=1&detail=zielgebiet&region=-1&ziel=-1&termin=20.02.2011&ruecktermin=17.03.2011&dauer=-1&abflughafen=46&personen=25;25&kategorie=-1&verpflegung= -1&齊默= -1

我試圖解析此頁面的HTML部分,但是當我檢查源代碼時,找不到:“ Tunesien,Marokko”。

如果我與xdeveloper核對,我可以看到它是html:

<a class="reglreg" href="javascript:s_hliste(20009);">Tunesien, Marokko</a>

但是,如果我檢查頁面的源代碼,我找不到此。 為什么?

如果查看源代碼並搜索“ Marokko”,您會發現它發生在幾個地方(作為數據加載到多個JavaScript數組中)。

似乎某些內容是通過加載到頁面上的JavaScript動態生成的。 JavaScript會構建HTML並更改頁面以包含您要查找的內容。

回答您的第一個真實問題

為什么?

因為當您在瀏覽器中檢查源代碼時 ,您將獲得原始的html代碼。 然后,出現了javascript並修改了DOM ,您可以在任何現代瀏覽器的控制台中遵循該DOM

我能以某種方式獲得整個源代碼嗎? 如果我無法在瀏覽器中看到它,該怎么看?

為了簡單起見,這取決於您嘗試解析它的方式。 用什么語言?

也許數據是通過AJAX調用來的,所以它在開始時不在html上,而是動態添加到其中。

如果需要對此進行解析,則可以嘗試自己“模擬” ajax調用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM