[英]Regex Preg_match_all match all pattern
这是我的担忧,我有一个琴弦,我需要两三个地提取字法。
$str = "abcdef"
应该返回array('ab', 'bc', 'cd', 'de', 'ef')
。 我想使用preg_match_all
而不是loops
。 这是我正在使用的模式。
$str = "abcdef";
preg_match_all('/[\w]{2}/', $str);
问题是,它返回Array('ab', 'cd', 'ef')
。 它错过了'bc'
和'de'
。
如果要提取一定数量的单词,我也会遇到同样的问题
$str = "ab cd ef gh ij";
preg_match_all('/([\w]+ ){2}/', $str); // returns array('ab cd', 'ef gh'), I'm also missing the last part
我想念什么? 还是使用preg_match_all
根本不可能做到这一点?
对于第一个问题,您想要做的是匹配重叠的string ,这需要零宽度 (不消耗文本)的环顾四周来抓住字符:
/(?=(\w{2}))/
上面的正则表达式将在第一个捕获组中捕获匹配项。
对于第二个问题,看来您也想要重叠的字符串。 使用相同的技巧:
/(?=(\b\w+ \w+\b))/
请注意,已添加\\b
以检查单词的边界。 由于该匹配不消耗文本,因此将在下一个索引(位于第一个单词的中间)而不是第二个单词的末尾尝试下一个匹配。 我们不想从单词的中间捕获,因此我们需要边界检查。
请注意, \\b
的定义基于\\w
,因此,如果您更改单词的定义,则需要使用相应的字符集来模拟单词边界,并且要先行模拟。
如果您需要非正则表达式解决方案,请尝试此...
<?php
$str = "abcdef";
$len = strlen($str);
$arr = array();
for($count = 0; $count < ($len - 1); $count++)
{
$arr[] = $str[$count].$str[$count+1];
}
print_r($arr);
?>
请参阅键盘 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.