標簽[codepoint] - 堆棧內存溢出

“？”是什么意思？運營商在Elixir做什么？

[英]What does the "?" operator do in Elixir?

Ecto 源代碼使用表達式?0 、 ?1等。您可以看到它們是如何求值的：那是什么意思呢？這很難搜索。 ?<character>的實際作用是什么？ ...

如何通過 LIKE '%\xC2\xA0%' 找到 UTF-8 代碼？

[英]How to find UTF-8 codes via LIKE '%\xC2\xA0%'?

我有一列包含 NO-BREAK SPACE (\xC2\xA0) 而不是 SPACE，我需要找到那些行。復制粘貼作品：但使用代碼點不會：如何通過 \x 代碼點找到列包含此類符號的行？ ...

如何在字符串中添加 '#' 符號/表情符號，使其在調用 `split('#')` 方法時不會拆分字符串？

[英]How can I add '#' symbol/emoji in a string such that it doesn't splits the string when `split('#')` method is called on it?

JavaScript 中是否有一種方法可以在字符串中顯示類似於 '#' 的符號，以便"Enter #time to check time".split('#')不會將其分成幾部分？它應該返回一個完整的字符串而不是['Enter ','time to check time'] 。我嘗試使用這 ...

如何按代碼點值對 JavaScript 中的字符串進行排序？

[英]How to sort strings in JavaScript by code point values?

我需要對一個字符串數組進行排序，其中元素按字典順序作為代碼點值序列進行比較，例如， "Z" < "a" < "\?" < " " < "💩" 。除了手動迭代它們並比較相應的代碼點之外，是否有更有效的方法來比較字符串？如果保證字符串沒有任何代理代碼點（但可能有代 ...

在 unicode 標准中，為什么 U+12ca = 0x12ca？ 0從何而來，0x12ca = 4810十進制如何

[英]In unicode standard, why does U+12ca = 0x12ca? Where does the 0 come from and how does 0x12ca = 4810 decimal

我正在學習 Unicode 基礎知識，我遇到了這段話： “Unicode 標准描述了字符如何由代碼點表示。代碼點是 integer 值，通常以 16 為基數表示。在標准中，代碼點使用符號 U+12ca 來表示值為 0x12ca 的字符（ 4810 十進制）。” 我有三個問題。 ca 代表什么？ ...

Unicode 標准第四章的字符和數字

[英]Characters and digits of Chapter four of the Unicode Standard

在語言規范中，有誰能告訴我如何正確表示any code points which are characters as defined by the Unicode character properties, chapter four of the Unicode Standard在詞法分析器中 ...

為簡體中文標識符構建令牌

[英]Build a token for Simplified Chinese Identifiers

我正在嘗試為簡體中文標識符構建一個令牌。簡體中文標識符在規范中定義如下：這是UNICODE-BESTFIT和Windows Codepage 936 。例如，我所做的是在頁面中查找%xA3C1 ，然后取其對應的代碼，即0xff21 。因此，我找到了%xA3C1 、 %xA3DA 、 %xA ...

從代碼點整數列表生成一個字符串對象？

[英]Generate a String object from a List of code point integers?

如果我有一個List< Integer >其整數值是 Unicode代碼點數。如何構造由這些代碼點確定的字符的String對象？例如： … 要么：如何從codePoints獲取另一個值為cat String對象？ ...

java從unicode代碼點獲取unicode表示字符串

[英]java get unicode representation string from unicode codepoint

我想從整數代碼點獲取 java 使用的字符串表示形式\\u\u003c/code> 。我找遍了整個地方，還沒有找到\?\?的工作 awnswer，它是 🦂 。我通過從字節碼查看器編譯和反編譯 jar 得到了符號。我不知道它是如何獲取這些字符串的或從哪里獲取的。在 java 中開發復制 ...

在 Elixir 中計算字符串中的代碼點

[英]Count codepoints in a string in Elixir

所述String.length/1函數返回字形的在UTF-8個二進制數。如果我想知道字符串中有多少個 Unicode代碼點，我知道我可以這樣做： string |> String.codepoints |> length 但這會產生一個不必要的所有代碼點的中間列表，並迭代字符兩次 ...

在 unicode 代碼點列表中查找連續范圍

[英]Find continuous range in a list of unicode code points

我有一個 unicode 代碼點列表，大致如下（不是實際集合，僅問題說明）：我需要找到這些的unicode-range 。該集合的某些部分是連續的，缺少一些點-因此范圍不是U+050B-1EA0 。有沒有一種合理的方法來提取那些連續的“子范圍”？ ...

在松弛中粘貼 JSON 會將一些 unicode 字符更改為其他類似字符...為什么

[英]Pasting JSON in slack changes some unicode characters to other similar ones...why

在 SLACK 中復制如下所示的簡單 JSON 請求正文在我的請求中使用后會引發錯誤我注意到在嘗試將其轉換為 ASCII 時，在 slack 中粘貼此代碼之前和之后的 '"' 字符是不同的 unicode 代碼點。這是 slacks 在做什么？或者這是由於他們的字體或某物？ " 變成合適的左右引 ...

如何反轉“String.fromCodePoint”，即將字符串轉換為代碼點數組？

[英]How do I reverse `String.fromCodePoint`, i.e. convert a string to an array of code points?

String.fromCodePoint(...[127482, 127480])給了我一面美國國旗 ()。如何將標志轉回[127482, 127480] ？ ...

為什么 String.fromCharCode(0xd800) 到 String.fromCharCode(0xdfff) 返回替換字符？

[英]Why does String.fromCharCode(0xd800) to String.fromCharCode(0xdfff) return the replacement character?

為什么會這樣：> String.fromCharCode(0xd7FF) '퟿' > String.fromCharCode(0xd800) '�' > String.fromCharCode(0xdffe) // (and everything in between) '�' ...

如何在 java 中按 Unicode 代碼點（UTF8 或 UTF32）排序順序排序？

[英]How to sort in Unicode code point (UTF8 or UTF32) sorted order in java?

Java 的 String.compareTo 使用 UTF16 排序順序。上面的代碼結果為排序順序[zion,, ﬁgure, ﬂagship]但是，我希望這個排序順序是[zion, ﬁgure, ﬂagship, ]請注意，有些字符是連字。 ...

在 PHP PCRE 語法中，如何指定多代碼點 Unicode 字符/“表情符號”？

[英]In PHP PCRE syntax, how does one specify a multi-codepoint Unicode character/"emoji"?

代碼：預期輸出：實際輸出：分析：成功刪除了單碼點表情符號，但未檢測到多碼點表情符號。進行的研究：閱讀以下內容： https : //www.php.net/manual/en/regexp.reference.escape.php 在“\\x”之后，最多讀取兩個十 ...

Gforth - 如何獲取字符串的代碼點？

[英]Gforth - How to get codepoints of a string?

我知道 gforth 將字符作為它們的代碼點存儲在堆棧中，但是我正在學習的材料沒有顯示任何有助於將每個字符轉換為代碼點的單詞。我還想對字符串的代碼點求和。我應該用什么來做到這一點？ ...

2 字節的 char 數據類型是否不足以處理 Unicode 字符串中的“字符”概念？

[英]Isn't a 2-byte char datatype insufficient to deal with the concept of "characters" in a Unicode string?

各種編程語言使用 2 字節的char數據類型（不要與 C/C++ 的char混淆，它只是一個字節），從中構造字符串。各種實用函數將嘗試在字符串中查找這樣的char ， e在hello查找e ，或執行其他接受或返回char的操作（拆分、索引、替換、計算字符串中字符出現的次數、長度、 ……）。如果 ...

性格問題

[英]Character Issues

背景故事我基本上從數據庫中檢索字符串。我更改了一些文本或那些字符串。然后我將這些字符串上傳回數據庫，替換原始字符串。在查看了顯示這些字符串的前端后，我注意到了字符問題。我不再有原始字符串，但我有更新后的字符串。問題這些字符串中包含來自其他語言的字符。它們現在無法正確顯示。我查看了 ...

如何獲取任何編碼 Java 字符串的 5 個字符？

[英]How to get 5 characters of any encoding Java-string?

問題如果有時編碼看起來像“UTF-8”、“UTF-16”和“ASCII”，我怎樣才能只得到字符串的 5 個字符？注意：一些測試輸入有表情符號。代碼例如：輸入： Bärteppich 預期的 Output： BГ¤rte也意味着Bärte 實際 Output： BГ¤rt 輸入： brühe ...