簡體   English   中英

如何從HTML代碼獲取所有標簽?

[英]How to get all tags from a HTML code?

如何從字符串中的HTML代碼獲取所有標簽?

例:

$HTML = <<<HTML
<html>
    <head>
        <meta charset="UTF-8">
        <title>Hello World!</title>
    </head>
    <body>
        <p id="main">Hello World!</p>
        <img src="wallpaper.png">
    </body>
</html>
HTML;

getTags($HTML);

打印輸出(返回數組)-標簽:

array(html, head, meta, title, body, p, img)

要么

打印輸出-具有id屬性的標簽:

array(html, head, meta, title, body, [p, main], img)

僅供參考,我是HTML的新手。

除了打印出id之外,這將執行所有操作,但要弄清楚它應該不難:

<?php
$html = '<html>
<head>
    <meta charset="UTF-8">
    <title>Hello World!</title>
</head>
<body>
    <p id="main">Hello World!</p>
    <img src="wallpaper.png">
</body>
</html>';

$dom = new DOMDocument();
$list=array();
$dom->loadHTML($html);
$elements = $dom->getElementsByTagName('*');
foreach($elements as $child)
{
  $list[]= $child->nodeName;
}
?>

回答:

Array ( [0] => html [1] => head [2] => meta [3] => title [4] => body [5] => p [6] => img )

使用HTML解析器讀取字符串。 快速的Google指示您可以直接使用PHP進行此操作: http : //php.net/manual/en/domdocument.loadhtml.php

我敢肯定,還有其他不錯的HTML解析器可用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM