繁体   English   中英

将字符串拆分为多个部分,同时保留所有非单词字符

[英]Splitting string into sections while maintaining all non-word characters

我正致力于加密功能,只是为了好玩(对于非生产环境)。 目前正在运行我的加密函数,如下所示:

encrypt("This is a string.");   

生成以下字符串:

GnulHynkAfdsGknp AfdsGknp Wgbf GknpLnugBuipAfdsCbhgByfg.

这是完美的,正是我想要和期望的 - 但是,现在我正在尝试编写解密函数。 每个加密的字符都有一个大写字母后跟3个非大写字母(正如您从上面的例子中看到的那样)。

我的计划是运行preg_split()来获取字符串的不同字母。

这是我目前的PHP代码(模式([AZ][az]{3}) ):

print_r(preg_split("/([A-Z][a-z]{3})/", $string));

这有几个问题。 在测试时,我发现它没有返回我的预期,返回的是:

Array
(
    [0] => 
    [1] => 
    [2] => 
    [3] => 
    [4] =>  
    [5] => 
    [6] =>  
    [7] =>  
    [8] => 
    [9] => 
    [10] => 
    [11] => 
    [12] => 
    [13] => .
)

(通过eval.in

所以这有适当的回报,但它们都是空白的。 为什么所有值都是空白的?

我想到的另一件事是我需要在preg_split()返回中包含其他字符,如空格,逗号,句点等。 在我从eval.in获得的回报中,似乎已经包含了最后一段时间。 对于空格和其他角色也是如此,或者在这些角色的情况下我是否需要做一些特别的事情?

它在这些比赛中“ 分裂 ”,因此它们被删除。 您需要preg_match_all或将PREG_SPLIT_DELIM_CAPTUREPREG_SPLIT_NO_EMPTY一起使用。

print_r(preg_split("/([A-Z][a-z]{3})/",
                   $string,
                   null,
                   PREG_SPLIT_DELIM_CAPTURE|PREG_SPLIT_NO_EMPTY));

您应该删除捕获组()并使用preg_match_all

$text = "GnulHynkAfdsGknp AfdsGknp Wgbf GknpLnugBuipAfdsCbhgByfg.";
preg_match_all("/[A-Z][a-z]{3}|(?: |,|\.)/", $text, $match);
print_r($match);

输出

Array
(
    [0] => Array
        (
            [0] => Gnul
            [1] => Hynk
            [2] => Afds
            [3] => Gknp
            [4] =>  
            [5] => Afds
            [6] => Gknp
            [7] =>  
            [8] => Wgbf
            [9] =>  
            [10] => Gknp
            [11] => Lnug
            [12] => Buip
            [13] => Afds
            [14] => Cbhg
            [15] => Byfg
            [16] => .
        )
)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM