用於多行HTML注釋的正則表達式（preg_match_all）

Question

我有一個帶有多個注釋掉的PHP數組的html文檔，例如：

<!-- Array
(
[key] => 0
)
-->

使用PHP，我需要以某種方式僅解析這些注釋的HTML（還有其他需要忽略的注釋）並提取內容。 我一直在嘗試使用preg_match_all但是我的正則表達式技能並不高。 有人能指出我正確的方向嗎？

任何幫助深表感謝！

Answer 1

如何使用允許您訪問注釋（例如，簡單HTML DOM ）然后使用strpos檢查每個注釋中是否有新行的HTML解析器。

$html = str_get_html('...HTML HERE...');
$comments = $html->find('comment');
foreach ( $comments as $comment ){
    if ( strpos($comment, "\n") !== false ){
        //process comment
    }
}

Answer 2

這里有三個事實

在HTML文檔中，沒有任何地方可以顯示文字“ <!-- ”而並不表示注釋（在其他任何地方都將其轉義為“ &!-- ”）
您似乎不想更改文檔的內容，只想查找其中的位（搜索和替換很有可能會破壞文檔，僅搜索並沒有）
注釋不能嵌套在HTML中（與普通的HTML標簽相反）-這使所有區別

上面的組合意味着（lo和behold）正則表達式可用於標識HTML注釋。

嘗試此正則表達式：  。 匹配組1將包含"Array"之后的所有內容，直至注釋的關閉順序。

您可以對找到的位進行進一步的完整性檢查，以確保它們確實是您所要的。

Answer 3

不要用正則表達式解析HTML。 永遠。

用於多行HTML注釋的正則表達式（preg_match_all）

問題描述

3 個解決方案

解決方案1
2 2010-04-06 12:22:35

解決方案2
2 已采納 2010-04-06 13:25:09

解決方案3
-2 2010-04-06 12:23:07

用於多行HTML注釋的正則表達式（preg_match_all）

問題描述

3 個解決方案

解決方案1 2 2010-04-06 12:22:35

解決方案2 2 已采納 2010-04-06 13:25:09

解決方案3 -2 2010-04-06 12:23:07

解決方案1
2 2010-04-06 12:22:35

解決方案2
2 已采納 2010-04-06 13:25:09

解決方案3
-2 2010-04-06 12:23:07