如何從HTML代碼獲取所有標簽？

Question

如何從字符串中的HTML代碼獲取所有標簽？

例：

$HTML = <<<HTML
<html>
    <head>
        <meta charset="UTF-8">
        <title>Hello World!</title>
    </head>
    <body>
        <p id="main">Hello World!</p>
        <img src="wallpaper.png">
    </body>
</html>
HTML;

getTags($HTML);

打印輸出（返回數組）-標簽：

array(html, head, meta, title, body, p, img)

要么

打印輸出-具有id屬性的標簽：

array(html, head, meta, title, body, [p, main], img)

僅供參考，我是HTML的新手。

Answer 1

除了打印出id之外，這將執行所有操作，但要弄清楚它應該不難：

<?php
$html = '<html>
<head>
    <meta charset="UTF-8">
    <title>Hello World!</title>
</head>
<body>
    <p id="main">Hello World!</p>
    <img src="wallpaper.png">
</body>
</html>';

$dom = new DOMDocument();
$list=array();
$dom->loadHTML($html);
$elements = $dom->getElementsByTagName('*');
foreach($elements as $child)
{
  $list[]= $child->nodeName;
}
?>

回答：

Array ( [0] => html [1] => head [2] => meta [3] => title [4] => body [5] => p [6] => img )

Answer 2

使用HTML解析器讀取字符串。 快速的Google指示您可以直接使用PHP進行此操作： http : //php.net/manual/en/domdocument.loadhtml.php

我敢肯定，還有其他不錯的HTML解析器可用。

如何從HTML代碼獲取所有標簽？

問題描述

2 個解決方案

解決方案1
1 已采納 2014-08-31 01:33:19

解決方案2
-1 2014-08-31 01:01:25

如何從HTML代碼獲取所有標簽？

問題描述

2 個解決方案

解決方案1 1 已采納 2014-08-31 01:33:19

解決方案2 -1 2014-08-31 01:01:25

解決方案1
1 已采納 2014-08-31 01:33:19

解決方案2
-1 2014-08-31 01:01:25