我无法在搜索页面中获取特定的URL

Question

我进入房地产网站，并按城市名称搜索。 之后，我想获取大阪市的建筑物URL。 在这里http://brillia.com/search/?area=27999 其中有四个。

我正在使用该链接来获取URL。

$allDivs = $parser->getElementsByTagName('div');
    foreach ($allDivs as $div) {
        if ($div->getAttribute('class') == 'boxInfomation') {
            $allLinks = $div->getElementsByTagName('a');
            foreach ($allLinks as $a) {
                $linkler[] = $a->getAttribute('href');
            }
        }
    }

但是我不能抓住那些。 实际上，我不仅抓取了大阪城市页面的URL，还抓取了所有这些URL。 当我尝试查看大阪网页的来源时。 它显示了http://brillia.com/search/这就是为什么我要抓住所有其他链接的原因...

但是我如何才能只在这里获取URL-> http://brillia.com/search/?area=27999

任何想法？ 谢谢。

Answer 1

您可以使用jQuery来做到这一点吗？ 在这种情况下，这个抢a href

 $("div h3 a").each(function(){
    var link = $(this).attr("href");
    console.log(link);
 });

这是一个jsfiddle测试

Answer 2

解析器依靠libxml来提取元素，但是该页面大量使用html5，省略了某些关闭标签，等等，而这并不是严格的xml，因此它通过猜测在哪里关闭丢失的标签，返回错误的结果而努力“纠正错误”。。

您需要一个具有html5支持的解析器，例如HTML5DOMDocument ，该解析器可以扩展DOMDocument并应具有大致相同的接口。

我无法在搜索页面中获取特定的URL

问题描述

2 个解决方案

解决方案1
1 2018-10-05 06:58:25

解决方案2
1 2018-10-08 12:08:44

我无法在搜索页面中获取特定的URL

问题描述

2 个解决方案

解决方案1 1 2018-10-05 06:58:25

解决方案2 1 2018-10-08 12:08:44

解决方案1
1 2018-10-05 06:58:25

解决方案2
1 2018-10-08 12:08:44