繁体   English   中英

如何使用 DOMDocument 获取锚文本?

[英]How to get Anchor text using DOMDocument?

说我有这个 html:

<a href="http://example.com">Test</a>

我使用带有以下代码的DOMDocument解析它:

$dom = new DomDocument();
@$dom->loadHTML($html);
$urls = $dom->getElementsByTagName('a');

然后我运行这个代码:

foreach ($urls as $url)
{
    //echo "<br> {$url->getAttribute('href')} , {$url->getAttribute('title')}";
    foreach ($url->attributes as $a)
    {
        echo "<br>$a->name is $a->value";
    }
    echo "<hr><br>";
}

当我这样做时,我只看到“href”作为 url 的一个属性,无法获得“锚文本”(在上述情况下为“测试”)。 如何获取链接的锚文本?

foreach ($urls as $url) {
    $attributes = $url->attributes;
    echo "<br>$url->nodeValue is $attributes->href";
} 

使用DOMNode::$nodeValue

echo $url->nodeValue;
here is two line code may it help some one

$html   =   file_get_html($link);
foreach($html->find("a") as $key=>$val)
{
  echo $val->src;
  echo '\n';   
}

文本“Test”实际上是一个 DOM Text 节点,因此您可以通过遍历 $url 的子节点来获取内容。

您可以查看此帖子以获取解决方案: How to get innerHTML of DOMNode?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM