簡體   English   中英

通過 DOMDocument PHP 獲取 DIV 元素內容

[英]Get DIV Element contents thru DOMDocument PHP

我必須從網站的 div 中恢復一些新聞。 div的結構如下:

HTML 標記:

<ul id="news-accordion" class="rounded" style="padding: 2px;">
   <li class="o">
         <h3>
            <span>TITLE ARTICLE</span>
            <span>30/10/2014</span>
         </h3>
         <div style="display: none;">
              <p>text of article</p>
         </div>
   </li>
   <li class="e">
         <h3>
            <span>TITLE ARTICLE</span>
            <span>28/10/2014</span>
         </h3>
         <div style="display: none;">
              <p>text of article</p>
         </div>
   </li>
   <li class="o">
         <h3>
            <span>TITLE ARTICLE</span>
            <span>29/10/2014</span>
         </h3>
         <div style="display: none;">
              <p>text of article</p>
         </div>
   </li>                                                     
</ul>

PHP

<?php 

$doc = new DomDocument;
$doc->validateOnParse = true;
$doc->loadHtml(file_get_contents('http://www.xxxxxxxxx/news.php'));

$news = $doc->getElementById('news-accordion');

$li = $news->getElementsByTagName('li'); 

foreach ($li as $row){ 

    $title = $row->getElementsByTagName('h3'); 
    echo $title->item(0)->nodeValue."<br><br>"; 

    /*foreach ($title as $row2){ 
    echo $row2->nodeValue."<br><br>";
    //echo $row2->item(0)->nodeValue."<br><br>"; 
    }*/

    $text = $row->getElementsByTagName('p'); 
    echo utf8_decode($text->item(0)->nodeValue)."<br><br><br>"; 

}

?>

代碼工作正常,但是當我打印 span 標簽的內容時echo $title->item(0)->nodeValue; ,

兩個span的文本一起打印。

如何分別取兩個span的內容? 謝謝。

是的,您可以,只需調整->item()索引即可。 就像您在其他元素中所做的一樣,將其指向該標題元素,然后將其顯式指向那些跨度子元素:

foreach ($li as $row){ 

    $h3 = $row->getElementsByTagName('h3')->item(0);
    $title = $h3->getElementsByTagName('span')->item(0); // first span
    $date = $h3->getElementsByTagName('span')->item(1); // second span

    echo $title->nodeValue . '<br/>';
    echo $date->nodeValue . '<br/>';

    $text = $row->getElementsByTagName('p'); 
    echo utf8_decode($text->item(0)->nodeValue)."<br><br><br>"; 

}
$title = $row->getElementsByTagName('h3'); 
echo $title->item(0)->nodeValue."<br><br>"; 

用下面替換上面的兩行(而不是使用h3標簽使用span標簽)

$title = $row->getElementsByTagName('span'); 
echo $title->item(0)->nodeValue."<br><br>"; 
echo $title->item(1)->nodeValue."<br><br>"; 

它對我有用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM