如何通过正则表达式对以下字符串进行分组

Question

这是我要处理的字符串。（至少有一个带下划线的部分。最后一部分从未加下划线）

'_A._B._C._D._F.f'`

我期望

["A", "B", "C", "D", "F", "f"]

如何通过规律性地实现同样的效果，我试过，但不能循环相同的格式部分。

new RegExp('^[(_(.+)\\.)]+(.+)$')

Answer 1

您可以从匹配中排除点和下划线。

 var string = '_A._B._C._D._F.f', result = string.match(/[^._]+/g); console.log(result);

Answer 2

不使用正则表达式怎么样？

 str = '_A._B._C._D._F.f'.split('.') var alphabets = str.map(c => c.replace('_', '')); console.log(alphabets);

Answer 3

您可以使用split删除[._]+ （包含点或楼层的任何子字符串）和filter （删除初始空字符串）：

'_A._B._C._D._F.f'.split(/[._]+/).filter(function(s){ return s.length > 0})
# => [ "A", "B", "C", "D", "F", "f" ]

编辑：评论中建议的简化：

'_A._B._C._D._F.f'.split(/[._]+/).filter(Boolean)
# =>  [ "A", "B", "C", "D", "F", "f" ]

Answer 4

在你的正则表达式中，你尝试使用一个锚来匹配整个模式^来断言字符串的开头，然后是一个字符类，它只匹配几个字符中的一个（例如也可以写成[_(+\\\\.)]+ ）然后你捕获捕获组中的其余字符串并断言$行的结尾。

如果要先检查字符串的格式，可以使用更精确的模式。 当该模式匹配时，您可以对单个字符执行不区分大小写的匹配，因为该模式已经过验证：

 const regex = /^_[AZ](?:\\._[AZ])+\\.[az]$/; const str = `_A._B._C._D._F.f`; if (regex.test(str)) { console.log(str.match(/[az]/ig)); }

这将匹配：

Answer 5

字符串方法.match与全局标志，可以帮助您：

 console.log('_A._B._C._D._F.f'.match(/[az]+/gi))