簡體   English   中英

相當於C#的Char.IsSymbol的JavaScript

[英]JavaScript equivalent of C#'s Char.IsSymbol

我正在嘗試從字符串中剝離所有“ Unicode符號”。 也就是說,保留所有多語言字符,但刪除dingbatsarrow和所有其他內容。

C#有一個非常方便的函數,稱為Char.IsSymbol ,可以在字符串的所有字符上運行,當這些函數返回true時,該字符將被Char.IsSymbol

我一直在尋找在JavaScript中做類似的事情。 如果它是正則表達式,那么如何編譯符號字符的所有unicode范圍的列表? 我查看了XRegExp,但找不到僅過濾符號的內容。

XRegExp確實有你要找的支持- http://xregexp.com/plugins/#unicode

您可能會匹配\\pL\\pS 您可以在http://www.regular-expressions.info/unicode.html#category中找到典型unicode類別的完整列表

總體而言,Unicode非常棘手。 它給您帶來了很多麻煩,尤其是與不完全兼容Unicode的軟件(遺憾的是,其中包括JavaScript-參見https://mathiasbynens.be/notes/javascript-unicode中的一系列示例)。 JS通常以雙重編碼(HTML + JS,並且還有更糟的情況)運行,這進一步加劇了這一事實。 有人可能會找到一種繞過您的支票的方法,但恐怕沒有簡單的方法可以防止這種情況。 只是在監視:)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM