繁体   English   中英

Regex / PHP替换任何重复的(但灵活的)单词组

[英]Regex/PHP Replace any repeating (but flexible) word group

如何匹配重复为“ ANY GROUP”或“ ANYGROUP”的“ Any Group”

$string = "Foo Bar (Any Group - ANY GROUP Baz)
           Foo Bar (Any Group - ANYGROUP Baz)";

因此他们以“ Foo Bar(Any Group-Baz)”的身份返回

分隔符始终为-

这篇文章扩展了Regex / PHP替换任何重复的单词组

这与“任何组-任意组”匹配,但在不带空格的情况下重复则不匹配。

$result = preg_replace(
    '%
    (                 # Match and capture
     (?:              # the following:...
      [\w/()]{1,30}   # 1-30 "word" characters
      [^\w/()]+       # 1 or more non-word characters
     ){1,4}           # 1 to 4 times
    )                 # End of capturing group 1
    ([ -]*)           # Match any number of intervening characters (space/dash)
    \1                # Match the same as the first group
    %ix',             # Case-insensitive, verbose regex
    '\1\2', $subject);

这很丑陋(正如我所说的那样),但它应该可以工作:

$result = preg_replace(
    '/((\b\w+)\s+)               # One repeated word
    \s*-\s*
    \2
    |
    ((\b\w+)\s+(\w+)\s+)         # Two repeated words
    \s*-\s*
    \4\s*\5
    |
    ((\b\w+)\s+(\w+)\s+(\w+)\s+) # Three
    \s*-\s*
    \7\s*\8\s*\9
    |
    ((\b\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+)  # Four
    \s*-\s*
    \11\s*\12\s*\13\s*\14\b/ix', 
    '\1\3\6\10-', $subject);

最多6个字的解决方案是:

$result = preg_replace(
    '/
     (\(\s*)
     (([^\s-]+)
      \s*?([^\s-]*)
      \s*?([^\s-]*)
      \s*?([^\s-]*)
      \s*?([^\s-]*)
      \s*?([^\s-]*))
     (\s*\-\s*)
     \3\s*\4\s*\5\s*\6\s*\7\s*\8\s*
     /ix',
     '\1\2\9',
     $string);

检查这个演示

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM