繁体   English   中英

我无法在搜索页面中获取特定的URL

[英]I can't grab specific URL in search page

我进入房地产网站,并按城市名称搜索。 之后,我想获取大阪市的建筑物URL。 在这里http://brillia.com/search/?area=27999 其中有四个。

我正在使用该链接来获取URL。

$allDivs = $parser->getElementsByTagName('div');
    foreach ($allDivs as $div) {
        if ($div->getAttribute('class') == 'boxInfomation') {
            $allLinks = $div->getElementsByTagName('a');
            foreach ($allLinks as $a) {
                $linkler[] = $a->getAttribute('href');
            }
        }
    }

但是我不能抓住那些。 实际上,我不仅抓取了大阪城市页面的URL,还抓取了所有这些URL。 当我尝试查看大阪网页的来源时。 它显示了http://brillia.com/search/这就是为什么我要抓住所有其他链接的原因...

但是我如何才能只在这里获取URL-> http://brillia.com/search/?area=27999

任何想法? 谢谢。

您可以使用jQuery来做到这一点吗? 在这种情况下,这个抢a href

 $("div h3 a").each(function(){
    var link = $(this).attr("href");
    console.log(link);
 });

这是一个jsfiddle测试

解析器依靠libxml来提取元素,但是该页面大量使用html5,省略了某些关闭标签,等等,而这并不是严格的xml,因此它通过猜测在哪里关闭丢失的标签,返回错误的结果而努力“纠正错误”。 。

您需要一个具有html5支持的解析器,例如HTML5DOMDocument ,该解析器可以扩展DOMDocument并应具有大致相同的接口。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM