[英]I can't grab specific URL in search page
我进入房地产网站,并按城市名称搜索。 之后,我想获取大阪市的建筑物URL。 在这里http://brillia.com/search/?area=27999
其中有四个。
我正在使用该链接来获取URL。
$allDivs = $parser->getElementsByTagName('div');
foreach ($allDivs as $div) {
if ($div->getAttribute('class') == 'boxInfomation') {
$allLinks = $div->getElementsByTagName('a');
foreach ($allLinks as $a) {
$linkler[] = $a->getAttribute('href');
}
}
}
但是我不能抓住那些。 实际上,我不仅抓取了大阪城市页面的URL,还抓取了所有这些URL。 当我尝试查看大阪网页的来源时。 它显示了http://brillia.com/search/
这就是为什么我要抓住所有其他链接的原因...
但是我如何才能只在这里获取URL-> http://brillia.com/search/?area=27999
任何想法? 谢谢。
您可以使用jQuery来做到这一点吗? 在这种情况下,这个抢a href
$("div h3 a").each(function(){
var link = $(this).attr("href");
console.log(link);
});
解析器依靠libxml
来提取元素,但是该页面大量使用html5,省略了某些关闭标签,等等,而这并不是严格的xml,因此它通过猜测在哪里关闭丢失的标签,返回错误的结果而努力“纠正错误”。 。
您需要一个具有html5支持的解析器,例如HTML5DOMDocument
,该解析器可以扩展DOMDocument
并应具有大致相同的接口。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.