[英]Getting HREF Values from content on page
我正在從這樣格式化的頁面獲取數據
<span id="RANDOMINFO">
<a href="/DEMO/RANDOMDATA">+</a>
<span title="1">DATA I WANT HERE</span>
<a href="https://URL.COM/">CLICK</a>
<a href="https://URL.COM/">MORE RANDOM DATA</a>
</span>
<span id="RANDOMINFO">
<a href="/DEMO/RANDOMDATA">+</a>
<span title="2">DATA I WANT HERE</span>
<a href="https://URL.COM/RANDOM">CLICK</a>
<a href="https://URL.COM/RANDOM">MORE RANDOM DATA</a>
</span>
如何從頁面獲取href值
這是我必須從span ID
獲取數據的代碼,但不知道如何為href
進行操作,因為no name or id
$doc = new DOMDocument();
@$doc->loadHTML($html2);
foreach($doc->getElementsByTagName('span') as $element )
{
if (!empty($element->attributes->getNamedItem('id')->value))
{
$filename = 'newpks/'.$f.'.txt';
$file = fopen($filename,"a");
$data = $element->attributes->getNamedItem('id')->value.PHP_EOL;
fwrite($file,$data);
fclose($file);
$i++;
$end = $start;
}
}
我假設您只對帶有href
屬性的鏈接感興趣,然后我們知道標記的類型將為a
。 這應該足夠了(盡管我還無法測試代碼)。
我對代碼進行了一些優化,因為DOMNode
類是從DOMElement
繼承的,因此您可以使用hasAttribute
和getAttribute
代替。
foreach($doc->getElementsByTagName('a') as $element ) {
if ($element->hasAttribute('href')) {
$href = $element->getAttribute('href');
// Do your work here
}
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.