繁体   English   中英

如何通过正则表达式对以下字符串进行分组

[英]How to group the following strings by regular expression

这是我要处理的字符串。(至少有一个带下划线的部分。最后一部分从未加下划线)

'_A._B._C._D._F.f'`

我期望

["A", "B", "C", "D", "F", "f"]

如何通过规律性地实现同样的效果,我试过,但不能循环相同的格式部分。

new RegExp('^[(_(.+)\\.)]+(.+)$')

您可以从匹配中排除点和下划线。

 var string = '_A._B._C._D._F.f', result = string.match(/[^._]+/g); console.log(result); 

不使用正则表达式怎么样?

 str = '_A._B._C._D._F.f'.split('.') var alphabets = str.map(c => c.replace('_', '')); console.log(alphabets); 

您可以使用split删除[._]+ (包含点或楼层的任何子字符串)和filter (删除初始空字符串):

'_A._B._C._D._F.f'.split(/[._]+/).filter(function(s){ return s.length > 0})
# => [ "A", "B", "C", "D", "F", "f" ]

编辑:评论中建议的简化:

'_A._B._C._D._F.f'.split(/[._]+/).filter(Boolean)
# =>  [ "A", "B", "C", "D", "F", "f" ]

在你的正则表达式中,你尝试使用一个锚来匹配整个模式^来断言字符串的开头,然后是一个字符类 ,它只匹配几个字符中的一个(例如也可以写成[_(+\\\\.)]+ )然后你捕获捕获组中的其余字符串并断言$行的结尾。

如果要先检查字符串的格式,可以使用更精确的模式。 当该模式匹配时,您可以对单个字符执行不区分大小写的匹配,因为该模式已经过验证:

 const regex = /^_[AZ](?:\\._[AZ])+\\.[az]$/; const str = `_A._B._C._D._F.f`; if (regex.test(str)) { console.log(str.match(/[az]/ig)); } 

请参阅正则表达式演示

这将匹配:

  • ^断言strin的开始
  • _[AZ]匹配下划线和大写字符
  • (?:\\._[AZ])+ 1+次重复分组结构以匹配._后跟一个大写字符
  • \\.[az]匹配点和小写字符
  • $断言该行的结尾

字符串方法.match与全局标志,可以帮助您:

 console.log('_A._B._C._D._F.f'.match(/[az]+/gi)) 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM