正则表达式Preg_match_all匹配所有模式

Question

这是我的担忧，我有一个琴弦，我需要两三个地提取字法。

$str = "abcdef"应该返回array('ab', 'bc', 'cd', 'de', 'ef') 。 我想使用preg_match_all而不是loops 。 这是我正在使用的模式。

$str = "abcdef";
preg_match_all('/[\w]{2}/', $str);

问题是，它返回Array('ab', 'cd', 'ef') 。 它错过了'bc'和'de' 。

如果要提取一定数量的单词，我也会遇到同样的问题

$str = "ab cd ef gh ij";
preg_match_all('/([\w]+ ){2}/', $str); // returns array('ab cd', 'ef gh'), I'm also missing the     last part

我想念什么？ 还是使用preg_match_all根本不可能做到这一点？

Answer 1

对于第一个问题，您想要做的是匹配重叠的string ，这需要零宽度 （不消耗文本）的环顾四周来抓住字符：

/(?=(\w{2}))/

上面的正则表达式将在第一个捕获组中捕获匹配项。

演示

对于第二个问题，看来您也想要重叠的字符串。 使用相同的技巧：

/(?=(\b\w+ \w+\b))/

请注意，已添加\\b以检查单词的边界。 由于该匹配不消耗文本，因此将在下一个索引（位于第一个单词的中间）而不是第二个单词的末尾尝试下一个匹配。 我们不想从单词的中间捕获，因此我们需要边界检查。

请注意， \\b的定义基于\\w ，因此，如果您更改单词的定义，则需要使用相应的字符集来模拟单词边界，并且要先行模拟。

演示

Answer 2

如果您需要非正则表达式解决方案，请尝试此...

<?php

$str = "abcdef";
$len = strlen($str);

$arr = array();
for($count = 0; $count < ($len - 1); $count++)
{
    $arr[] = $str[$count].$str[$count+1];
}

print_r($arr);

?>

请参阅键盘。

正则表达式Preg_match_all匹配所有模式

问题描述

2 个解决方案

解决方案1
4 已采纳 2013-03-14 05:26:04

解决方案2
1 2013-03-14 05:28:35

正则表达式Preg_match_all匹配所有模式

问题描述

2 个解决方案

解决方案1 4 已采纳 2013-03-14 05:26:04

解决方案2 1 2013-03-14 05:28:35

解决方案1
4 已采纳 2013-03-14 05:26:04

解决方案2
1 2013-03-14 05:28:35