繁体   English   中英

查找特定正则表达式将匹配的字符串的算法

[英]Algorithm for finding strings that a specific Regex will match

给定正则表达式模式,我试图找到一个与之匹配的字符串。 与Django逆转它们的方式类似,但使用C#。 是否有任何预制的C#库可以做到这一点?


编辑:很快将这个项目移至Google代码

当前测试结果

^abc$                     > abc                  : pass
\Aa                       > a                    : pass
z\Z                       > z                    : pass
z\z                       > z                    : pass
z\z                       > z                    : pass
\G\(a\)                   > \(a\)                : pass
ab\b                      > ab                   : pass
a\Bb                      > ab                   : pass
\a                        >                     : pass
[\b]                      >                    : pass
\t                        > \t                   : pass
\r                        > \r                   : pass
\v                        > ♂                    : pass
\f                        > \f                   : pass
\n                        > \n                   : pass
\e                        > ←                    : pass
\141                      > a                    : pass
\x61                      > a                    : pass
\cC                       > ♥                    : pass
\u0061                    > a                    : pass
\\                        > \\                   : pass
[abc]                     > a                    : pass
[^abc]                    > î                    : pass
[a-z]                     > a                    : pass
.                         > p                    : pass
\w                        > W                    : pass
\W                        > ☻                    : pass
\s                        > \n                   : pass
\S                        > b                    : pass
\d                        > 4                    : pass
\D                        > G                    : pass
(a)\1                     > aa                   : pass
(?<n>a)\k<n>              > aa                   : pass
(?<n>a)\1                 > aa                   : pass
(a)(?<n>b)\1\2            > abab                 : pass
(?<n>a)(b)\1\2            > abba                 : pass
(a(b))\1\2                > ababb                : pass
(a(b)(c(d)))\1\2\3\4      > abcdabcdbcdd         : pass
a\0                       > a                    : pass
ab*                       > a                    : pass
ab+                       > abbb                 : pass
ab?                       > a                    : pass
ab{2}                     > abb                  : pass
ab{2,}                    > abbbbbbbbb           : pass
ab{2,3}                   > abb                  : pass
ab*?                      > abb                  : pass
ab+?                      > abbbbb               : pass
ab??                      > a                    : pass
ab{2}?                    > abb                  : pass
ab{2,}?                   > abbbbbbbbb           : pass
ab{2,3}?                  > abbb                 : pass
/users(?:/(?<id>\d+))?    > /users/77            : pass
Passed 52/52 tests.

例如参见使用Regex生成字符串而不是匹配它们

您也可以查看http://en.wikipedia.org/wiki/Deterministic_finite-state_machine,尤其是在“接受和生成模式”部分。

正如其他人指出的那样,您将需要从正则表达式创建DFA,然后使用该DFA生成字符串。

要将正则表达式转换为DFA,请先生成NFA(例如,参见http://lambda.uta.edu/cse5317/spring01/notes/node9.html ),然后再将NFA转换为DFA。

我看到的最简单的方法是为此使用解析器生成器程序。 我不认为django会这样做。

希望这可以帮助。

“是否有任何预制的C#库可以做到这一点?”

没有

(我希望这会暂时被接受为答案)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM