正則表達式模式匹配

Question

我想從包含html內容的字符串中提取第一次出現的（ <a>和<span>標簽）之間的文本。

我的模式如下：

$pattern='/<a[^(span)][\/\(\)-:@!%*>#=_|?$&";.\w\s]+<\/a> <span/um';

我得到的輸出是第一次出現的<a和最后一次出現的<span之間的文本，而不是兩次出現的第一次之間的文本。

例如html內容：

<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah  </a> <span>blah

想：

<a href="#">asdasdasd</a> <span

獲得：

<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah  </a> <span

Answer 1

使用HTML解析器解析HTML
使用惰性量詞'/<a[^(span)][\\/\$\$-:@!%*>#=_|?$&";.\\w\\s]+?<\\/a> <span/um';

Answer 2

您需要通過告訴正則表達式使<a和<span之間的字符盡可能少地匹配.+? ：

$ptn = '/<a.+?<span/';
$str = '<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah  </a> <span>blah';
preg_match($ptn, $str, $matches);
echo $matches[0];

結果為<a href=\\"#\\">asdasdasd</a> <span

正則表達式模式匹配

問題描述

2 個解決方案

解決方案1
1 已采納 2012-10-21 00:06:50

解決方案2
0 2012-10-21 00:15:35

正則表達式模式匹配

問題描述

2 個解決方案

解決方案1 1 已采納 2012-10-21 00:06:50

解決方案2 0 2012-10-21 00:15:35

解決方案1
1 已采納 2012-10-21 00:06:50

解決方案2
0 2012-10-21 00:15:35