簡體   English   中英

從頁面上的內容獲取HREF值

[英]Getting HREF Values from content on page

我正在從這樣格式化的頁面獲取數據

<span id="RANDOMINFO">
 <a href="/DEMO/RANDOMDATA">+</a>
 <span title="1">DATA I WANT HERE</span> 
<a href="https://URL.COM/">CLICK</a> 
<a href="https://URL.COM/">MORE RANDOM DATA</a>
</span>
<span id="RANDOMINFO">
 <a href="/DEMO/RANDOMDATA">+</a>
 <span title="2">DATA I WANT HERE</span> 
<a href="https://URL.COM/RANDOM">CLICK</a> 
<a href="https://URL.COM/RANDOM">MORE RANDOM DATA</a>
</span>

如何從頁面獲取href值

這是我必須從span ID獲取數據的代碼,但不知道如何為href進行操作,因為no name or id

       $doc = new DOMDocument();
        @$doc->loadHTML($html2);
                foreach($doc->getElementsByTagName('span') as $element ) 
                    { 
                        if (!empty($element->attributes->getNamedItem('id')->value)) 
                        { 
                        $filename = 'newpks/'.$f.'.txt';
                         $file = fopen($filename,"a");

                        $data = $element->attributes->getNamedItem('id')->value.PHP_EOL;
                        fwrite($file,$data);
                        fclose($file);
                        $i++;
                        $end = $start;
                        }
                    }

我假設您只對帶有href屬性的鏈接感興趣,然后我們知道標記的類型將為a 這應該足夠了(盡管我還無法測試代碼)。

我對代碼進行了一些優化,因為DOMNode類是從DOMElement繼承的,因此您可以使用hasAttributegetAttribute代替。

foreach($doc->getElementsByTagName('a') as $element ) { 
    if ($element->hasAttribute('href')) { 
        $href = $element->getAttribute('href');
        // Do your work here
    }
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM