PHP正则表达式的子字符串匹配，并且正则表达式并非始终有效

Question

我正在尝试创建类似BBCode的html解析器。 例如，我想用以下格式从html文本中解析项目： .....html..... [I]Item1[/I].....html....[I]Item2[/I]......
因此，我正在使用正则表达式获取[I]XXXXX[/I]我还希望正则表达式仅返回Item1以避免str_replace 。 目前，我将str_replace [I]与""和[/I]与""以获取Item1。 问题在于正则表达式并不总是有效。
我正在使用下面的代码：

$pattern="/\[I]([^\[].)+\[\/I]/m";
preg_match_all($pattern,$string,$out,PREG_SET_ORDER);
foreach($out as $i)
{
    $temp=$i[0];
    echo "Found!";
    $i[0]=str_replace("[I]","",$i[0]);
    $i[0]=str_replace("[/I]","",$i[0]);
    ......
}

我的正则表达式的意思是：以[I]开头并以[I] [以避免[I] [I] [/I] [/I] ）以外的任何字符继续，并以[/I]结束。 有些字符串失败，例如aaaaa而另一些则发现aaa aa ！ 也许有更好的方法来创建这样的HTML解析器？
谢谢！

编辑：好的，我找到了解决方案，但是我不明白为什么这行不通！ 解决方案是$pattern='#\\[i\\](.*?)\\[/i\\]#is'但是有什么区别？

编辑2：Raider是正确的，主要问题是在([^\\[.)+] 。 这将创建语言[I](a)^2n[/I]因此它将匹配[I]aa[/I] ，但不会匹配[I]aaaaa[/I] ！

Answer 1

尝试使用如下形式：

$parsed_str = '[I]Item1[/I].....html....[I]Item2[/I].....';
preg_match_all('~\[I\]([^\[.]+?)\[\/I\]~i', $parsed_str, $result);
print_r($result[1]);

通过以下方式得出相同的结果：

preg_match_all('~\[I\]([^\[].+?)\[\/I\]~i', $parsed_str, $result);

Answer 2

我认为您的子模式([^\\[].)+是问题。 试试([^\\[]+)

Answer 3

你的问题是对的

$temp=$i[0];

索引0包含整个匹配的模式。 相反，您需要使用索引1-正则表达式的第一个括号部分：

$temp = $i[1]

PHP正则表达式的子字符串匹配，并且正则表达式并非始终有效

问题描述

3 个解决方案

解决方案1
1 2011-08-31 20:39:14

解决方案2
1 已采纳 2011-08-31 20:39:34

解决方案3
1 2011-08-31 20:45:04

PHP正则表达式的子字符串匹配，并且正则表达式并非始终有效

问题描述

3 个解决方案

解决方案1 1 2011-08-31 20:39:14

解决方案2 1 已采纳 2011-08-31 20:39:34

解决方案3 1 2011-08-31 20:45:04

解决方案1
1 2011-08-31 20:39:14

解决方案2
1 已采纳 2011-08-31 20:39:34

解决方案3
1 2011-08-31 20:45:04