繁体   English   中英

带有后缀的简单键值对的Java正则表达式

[英]Java regular expression for simple key-value pairs with a suffix

考虑一组字符串,如下所示:

Memory size = 4,194,304 KB
Cache size=   32,768 K
Number of cores = 8
Note   =4,000,000 KB is less than 4 GB

是否存在通用且不太复杂的Java正则表达式,它完全匹配每个字符串并生成以下组?

"Memory size", "4,194,304", "KB"
"Cache size", "32,768", "K"
"Number of cores", "8"
"Note", "4,000,000 KB is less than 4 GB"

这些组是keyvalue和(可选) suffix

其他要求:

  • 值(即'='后面的部分)不一定是数字
  • “:”两侧的任何空格都应该在一次通过中被移除,而不会回溯
  • “KB”和“K”字符串匹配不区分大小写
  • 捕获的组应始终具有相同的索引(理想情况下,键/值/后缀为3组,所有匹配的组索引相同)

显然,一个简单的表达就像

  • ([^=]+) *: *([^=]+)

不完全涵盖上述规范。

完全涵盖上述规范的正则表达式是:

^([^=]+?) *= *(.+?) *$

编辑

结果我错过了K / KB部分。 这是修改后的版本:

^([^=]+?) *= *(.+?) *(KB?)? *$

这样的事情应该有效:

^(.*?)\s*=\s*(?:([\d,]+)\s*(K|KB)$|(.*))

^ - 匹配行的开头

(.*?)通过匹配任何东西来捕获左项( ?使它不贪婪;否则会占用所有空格)。

\\s*=\\s*匹配并丢弃等号及其周围的任何空格。

(?:([\\d,]+)\\s*(K|KB)$|(.*))这个长组匹配一个或另一个。 (?:使它成为非捕获组,因为你不想捕获整个事物。

([\\d,]+)\\s*(K|KB)$如果有一个数字后面跟着K或KB,那么字符串的结尾与两组相匹配。

(.*)否则,匹配一组中剩余的所有内容。

尝试一下,告诉我它是否有效:

(.*) *= *(.*) (.*)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM