[英]I can't grab specific URL in search page
我進入房地產網站,並按城市名稱搜索。 之后,我想獲取大阪市的建築物URL。 在這里http://brillia.com/search/?area=27999
其中有四個。
我正在使用該鏈接來獲取URL。
$allDivs = $parser->getElementsByTagName('div');
foreach ($allDivs as $div) {
if ($div->getAttribute('class') == 'boxInfomation') {
$allLinks = $div->getElementsByTagName('a');
foreach ($allLinks as $a) {
$linkler[] = $a->getAttribute('href');
}
}
}
但是我不能抓住那些。 實際上,我不僅抓取了大阪城市頁面的URL,還抓取了所有這些URL。 當我嘗試查看大阪網頁的來源時。 它顯示了http://brillia.com/search/
這就是為什么我要抓住所有其他鏈接的原因...
但是我如何才能只在這里獲取URL-> http://brillia.com/search/?area=27999
任何想法? 謝謝。
您可以使用jQuery來做到這一點嗎? 在這種情況下,這個搶a href
$("div h3 a").each(function(){
var link = $(this).attr("href");
console.log(link);
});
解析器依靠libxml
來提取元素,但是該頁面大量使用html5,省略了某些關閉標簽,等等,而這並不是嚴格的xml,因此它通過猜測在哪里關閉丟失的標簽,返回錯誤的結果而努力“糾正錯誤”。 。
您需要一個具有html5支持的解析器,例如HTML5DOMDocument
,該解析器可以擴展DOMDocument
並應具有大致相同的接口。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.