JavaScript 正則表達式空白字符

Question

我進行了一些搜索，但在 JavaScript 的正則表達式中找不到包含在\s中的空白字符的明確列表。

我知道我可以依賴空格、換行符、回車和制表符作為空格，但我認為由於 JavaScript 傳統上僅適用於瀏覽器，因此可能是 URL 編碼的空格和 之類的東西。 並且%20也將被支持。

JavaScript 的正則表達式編譯器到底考慮了什么？ 如果瀏覽器之間存在差異，我只關心 webkit 瀏覽器，但很高興知道任何差異。 另外，Node.js 呢？

Answer 1

一個簡單的測試：

for(var i = 0; i < 1114111; i++) {
    if(String.fromCodePoint(i).replace(/\s+/, "") == "") console.log(i);
}

字符代碼（Chrome）：

Answer 2

["

 [ \f\n\r\t\v\u00A0\u2028\u2029]

Answer 3

HTML != Javascript。 Javascript 完全是文字， %20 是 %20 和  是一串字符 & nbsp 和 ;。 對於字符類，我認為 perl 中幾乎所有 RegEx 都適用於 JS（你不能做命名組等）。

http://www.regular-expressions.info/javascript.html是我使用的參考。

Answer 4

這是primvdb 答案的擴展，涵蓋了整個 16 位空間，包括 unicode 代碼點值以及與 str.trim() 的比較。 我試圖編輯答案以改進它，但我的編輯被拒絕了，所以我不得不發布這個新的。

識別將匹配為空白正則表達式\s或String.prototype.trim()的所有單字節字符：

 const regexList = []; const trimList = []; for (let codePoint = 0; codePoint < 2 ** 16; codePoint += 1) { const str = String.fromCodePoint(codePoint); const unicode = codePoint.toString(16).padStart(4, '0'); if (str.replace(/\s/, '') === '') regexList.push([codePoint, unicode]); if (str.trim() === '') trimList.push([codePoint, unicode]); } const identical = JSON.stringify(regexList) === JSON.stringify(trimList); const list = regexList.reduce((str, [codePoint, unicode]) => `${str}${unicode} ${codePoint}\n`, ''); console.log({identical}); console.log(list);

列表（在 V8 中）：

JavaScript 正則表達式空白字符

問題描述

5 個解決方案

解決方案1
10 2011-05-20 14:52:22

解決方案2
6 2011-05-20 14:53:29

解決方案3
3 已采納 2011-05-20 14:53:10

解決方案4
2 2020-10-18 10:58:47

解決方案5
1 2011-05-20 14:57:33

JavaScript 正則表達式空白字符

問題描述

5 個解決方案

解決方案1 10 2011-05-20 14:52:22

解決方案2 6 2011-05-20 14:53:29

解決方案3 3 已采納 2011-05-20 14:53:10

解決方案4 2 2020-10-18 10:58:47

解決方案5 1 2011-05-20 14:57:33

解決方案1
10 2011-05-20 14:52:22

解決方案2
6 2011-05-20 14:53:29

解決方案3
3 已采納 2011-05-20 14:53:10

解決方案4
2 2020-10-18 10:58:47

解決方案5
1 2011-05-20 14:57:33