[英]Capture PHP links without image links
$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);
$links = $dom->getElementsByTagName('a');
foreach ($links as $link) {
我目前正在使用上述脚本在页面上捕获链接,但是我发现总是存在重复的链接。 在页面上,有链接的图片,然后是指向同一链接的文本链接。 是否有一种简单的方法可以仅捕获文本链接而不捕获图像链接?
正如我所说的,我可能会采用清理结果集中的重复对象的方法。 不确定要抓取的内容,但是如果链接仅与图像一起使用怎么办?
您甚至可以计算发生的次数。
$url = 'http://www.test.com/';
$dom = new DOMDocument;
@$dom->loadHTMLFile($url);
$links = $dom->getElementsByTagName('a');
$distinctLinks = [];
foreach ($links as $link) {
$distinctLinks[$link] = (int) $distinctLinks[$link] + 1;
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.