簡體   English   中英

我無法在搜索頁面中獲取特定的URL

[英]I can't grab specific URL in search page

我進入房地產網站,並按城市名稱搜索。 之后,我想獲取大阪市的建築物URL。 在這里http://brillia.com/search/?area=27999 其中有四個。

我正在使用該鏈接來獲取URL。

$allDivs = $parser->getElementsByTagName('div');
    foreach ($allDivs as $div) {
        if ($div->getAttribute('class') == 'boxInfomation') {
            $allLinks = $div->getElementsByTagName('a');
            foreach ($allLinks as $a) {
                $linkler[] = $a->getAttribute('href');
            }
        }
    }

但是我不能抓住那些。 實際上,我不僅抓取了大阪城市頁面的URL,還抓取了所有這些URL。 當我嘗試查看大阪網頁的來源時。 它顯示了http://brillia.com/search/這就是為什么我要抓住所有其他鏈接的原因...

但是我如何才能只在這里獲取URL-> http://brillia.com/search/?area=27999

任何想法? 謝謝。

您可以使用jQuery來做到這一點嗎? 在這種情況下,這個搶a href

 $("div h3 a").each(function(){
    var link = $(this).attr("href");
    console.log(link);
 });

這是一個jsfiddle測試

解析器依靠libxml來提取元素,但是該頁面大量使用html5,省略了某些關閉標簽,等等,而這並不是嚴格的xml,因此它通過猜測在哪里關閉丟失的標簽,返回錯誤的結果而努力“糾正錯誤”。 。

您需要一個具有html5支持的解析器,例如HTML5DOMDocument ,該解析器可以擴展DOMDocument並應具有大致相同的接口。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM