JavaScript 正则表达式空白字符

Question

我进行了一些搜索，但在 JavaScript 的正则表达式中找不到包含在\s中的空白字符的明确列表。

我知道我可以依赖空格、换行符、回车和制表符作为空格，但我认为由于 JavaScript 传统上仅适用于浏览器，因此可能是 URL 编码的空格和 之类的东西。 并且%20也将被支持。

JavaScript 的正则表达式编译器到底考虑了什么？ 如果浏览器之间存在差异，我只关心 webkit 浏览器，但很高兴知道任何差异。 另外，Node.js 呢？

Answer 1

一个简单的测试：

for(var i = 0; i < 1114111; i++) {
    if(String.fromCodePoint(i).replace(/\s+/, "") == "") console.log(i);
}

字符代码（Chrome）：

Answer 2

["

 [ \f\n\r\t\v\u00A0\u2028\u2029]

Answer 3

HTML != Javascript。 Javascript 完全是文字， %20 是 %20 和  是一串字符 & nbsp 和 ;。 对于字符类，我认为 perl 中几乎所有 RegEx 都适用于 JS（你不能做命名组等）。

http://www.regular-expressions.info/javascript.html是我使用的参考。

Answer 4

这是primvdb 答案的扩展，涵盖了整个 16 位空间，包括 unicode 代码点值以及与 str.trim() 的比较。 我试图编辑答案以改进它，但我的编辑被拒绝了，所以我不得不发布这个新的。

识别将匹配为空白正则表达式\s或String.prototype.trim()的所有单字节字符：

 const regexList = []; const trimList = []; for (let codePoint = 0; codePoint < 2 ** 16; codePoint += 1) { const str = String.fromCodePoint(codePoint); const unicode = codePoint.toString(16).padStart(4, '0'); if (str.replace(/\s/, '') === '') regexList.push([codePoint, unicode]); if (str.trim() === '') trimList.push([codePoint, unicode]); } const identical = JSON.stringify(regexList) === JSON.stringify(trimList); const list = regexList.reduce((str, [codePoint, unicode]) => `${str}${unicode} ${codePoint}\n`, ''); console.log({identical}); console.log(list);

列表（在 V8 中）：

JavaScript 正则表达式空白字符

问题描述

5 个解决方案

解决方案1
10 2011-05-20 14:52:22

解决方案2
6 2011-05-20 14:53:29

解决方案3
3 已采纳 2011-05-20 14:53:10

解决方案4
2 2020-10-18 10:58:47

解决方案5
1 2011-05-20 14:57:33

JavaScript 正则表达式空白字符

问题描述

5 个解决方案

解决方案1 10 2011-05-20 14:52:22

解决方案2 6 2011-05-20 14:53:29

解决方案3 3 已采纳 2011-05-20 14:53:10

解决方案4 2 2020-10-18 10:58:47

解决方案5 1 2011-05-20 14:57:33

解决方案1
10 2011-05-20 14:52:22

解决方案2
6 2011-05-20 14:53:29

解决方案3
3 已采纳 2011-05-20 14:53:10

解决方案4
2 2020-10-18 10:58:47

解决方案5
1 2011-05-20 14:57:33