![](/img/trans.png)
[英]How to convert surrogate pairs into hexadecimal, and vice-versa in Python?
我如何將代理對的字符轉換為十六進制? 我發現使用hex()和ord()適用於具有單個代碼點的字符,例如像“”這樣的表情符號。 例如: 同樣,使用chr()和int()可以從十六進制中獲取字符: 但是,一旦我使用代理項對,例如像“”這樣的表情符號,代碼就會拋出錯誤: 我該如何解決這個問題,如何將這種 ...
[英]How to convert surrogate pairs into hexadecimal, and vice-versa in Python?
我如何將代理對的字符轉換為十六進制? 我發現使用hex()和ord()適用於具有單個代碼點的字符,例如像“”這樣的表情符號。 例如: 同樣,使用chr()和int()可以從十六進制中獲取字符: 但是,一旦我使用代理項對,例如像“”這樣的表情符號,代碼就會拋出錯誤: 我該如何解決這個問題,如何將這種 ...
[英]Unicode conversion in XML failed
作為對 web 服務調用的響應,我得到了一個 XML 再次,必須轉換為 JSON 以便下次調用。 此轉換失敗並出現錯誤 F-XSLT 41252:XSLT 轉換錯誤:org.xml.sax.SAXParseException; 字符引用“&#55349”是無效的 XML 字符。 ...
[英]XML marshalling of surrogate pairs
當涉及代理對時,我遇到了 marshaller 的奇怪行為。 為什么 JAXB 編組器添加不必要的(無效的)XML 實體? 當我嘗試編組以下內容時: ?,例如 55357 56499 代碼點 Mashaller 輸出 128179 代碼點(有效並代表 XML 中的代理對)和不必要的 56499(這 ...
[英]unicode utf-16 surrogate pair print problem
在 Visual Studio /C++ 中聲明了一個 wstring c 並用代理對填充它( Unicode 0001F01C = Mahong tile ) 當我打印出這個值時,我希望得到這個 Unicode 號碼。 但是我得到了 d83c 。 誰能告訴我為什么我沒有得到 Unicode 值? ...
[英]What unicode character (emoji) it was?
我的文本文件中有那個字符串: ├░┬č┬Ź┬ć 已知的是它是表情符號或至少是由長度為 2 或 4 的 javascript 字符串創建的一些代理字符/字符 由於某種原因,它最終以這種形式結束。 (它是從 mysql 數據庫utf8_general_ci和 node.js/mysql2/conne ...
[英]C# UNITY Unicode Emoji Display
我正在從源系統接收以下格式的表情符號。 '\❤' 為 ❤ '\?\?' 為😂 我需要知道如何轉換它,因此它在 Unity 調試日志和文本字段中顯示為正確的表情符號。 請幫我。 當我嘗試以下代碼時 我得到 '\❤' 為 ❤ '\?\?' 為😂 當我嘗試以下代 ...
[英]Why does the UTF-16 bytes for emoji smiley and emoji flag together looks different than a sequence of their individual UTF-16 bytes?
以下來自 Visual Studio 的 C# 交互式編譯器: 表情符號笑臉的代碼單元是預期的代理對 - “D8-3D-DE-00” 表情符號標志的代碼單元是預期的代理對 - “D8-3C-DF-F4” 鑒於此,表情符號笑臉后跟表情符號標志的代碼單元不應該是 - “D8-3D-DE-00-D8-3 ...
[英]How to print surrogate chars as ints in Java
我有這個: 我將如何將c和d打印為十六進制字符串? 我想要d804為c和def4為d 。 ...
[英]How to display Unicode character names and their hexadecimal codes with PowerShell?
Since the default Windows PowerShell console fonts don't support Emojis, I'd like to display their surrogate pair hexadecimal codes and ideally also ...
[英]Spliting an emoji sequence in powershell
我有一個僅填充表情符號的文本框。 沒有空格或任何類型的字符。 我需要拆分這些表情符號以識別它們。 這是我嘗試過的: 循環不是一個一個地打印字節,而是只運行一次,打印所有連接在一起的表情符號的代碼。 就像所有的表情符號都是一個項目。 我用 6 個表情符號進行了測試,而不是得到這個: 61 216 7 ...
[英]How to Convert UTF-16 Surrogate Decimal to UNICODE in Java
我有一些字符串數據,如 &#55357 ;&#56842 ; 這些是十進制格式的 UTF 16 代理對。 如何在 Java 中將它們轉換為 Unicode 代碼點,以便我的客戶可以在沒有代理對的情況下理解 Unicode 十進制 html 實體? 示例: &#1 ...
[英]Converting surrogate pairs to emoji - python3
我在另一個主題上找到了類似問題的解決方案,但不幸的是,它不適用於我。 這是我的問題: 我正在從代理對unicode中創建數據幀,我想在另一個文件中進行搜索(例如:“ \\ uD83C \\ uDFF3”,“ \\ u26F9”,“ \\ uD83C \\ uDDE6 \\ uD83C \ ...
[英]Emojis to/from codepoints in Javascript
在我正在創建的混合 Android/Cordova 游戲中,我讓用戶以表情符號 + 字母數字的形式提供標識符 - 即 0..9、A..Z、a..z - 名稱。 例如 ️堆棧溢出在服務器端,用戶標識符與 Emoji 和 Name 部分分開存儲,只有 Name 部分要求是唯一的。 游戲不時顯示“聯賽表” ...
[英]Python Unicode - What Characters Can Be Printed in Windows Console?
哪些 Unicode 字符可以從 Python 打印在 Windows 控制台中? 以下代碼 給出了不起眼的結果,包括一個錯誤: UnicodeEncodeError: 'utf-8' codec can't encode character '\?' in position 0: surr ...
[英]PHP json_decode does not work with single unpaired surrogate caused by Node 12 well-formed JSON.stringify
Node 12 現在使用格式良好的 JSON.stringify ,它為單獨的代理輸出轉義序列。 當有一個單獨的代理被轉義時,PHP 無法對此進行 json_decode。 以 Node.js 中的以下代碼示例為例。 var a = '𝘥𝘦𝘴𝘪𝘨𝘯𝘦𝘳 𝘢𝘯𝘥 𝘪𝘭𝘭 ...
[英]How to reverse strings that contain surrogate pairs in Dart?
我正在使用 Dart 玩算法,當我實際遵循 TDD 時,我意識到我的代碼有一些限制。 作為面試問題的一部分,我試圖反轉字符串,但我無法正確反轉代理對。 output: 您可以看到簡單的表情符號被正確反轉,因為我使用的是runes而不是簡單地執行s.split('').toList().rever ...
[英]Replacing emoji from a string
我是vb net的新手。 我正在嘗試處理包含表情符號的字符串,但我不能這樣做。 我的字符串看起來像這樣:💛💛💙💛我想用replace替換💛我正在做的是使用string.remove和string.add,但我得到代理對錯誤。 ...
[英]Should StringIO(HighSurrogate) throw an error in Python 2.7?
當我運行這個Python 2.7代碼( 編輯:更新代碼 ) CPython運行正常,但IronPython引發以下錯誤: 我認為這是因為U + D801是一個不成對的代理,因此是一個無效的字符 ,但是哪個實現在這里顯示正確的行為? 該代碼是否應拋出? ...
[英]Python unicode indexing shows different character
我在包含Unicode字符的Python 2.7.10的“窄”版本中有一個Unicode字符串。 我試圖使用該Unicode字符作為字典中的查詢,但是當我為該字符串編制索引以獲取最后的Unicode字符時,它將返回另一個字符串: 為什么會發生這種情況,如何從字符串中檢索'\\U0001 ...
[英]C# - Regular expression to find a surrogate pair of a unicode codepoint from any string?
我正在嘗試解析可能包含表情符號的消息。 可能收到的示例消息如下: 應該匹配的是\\ u00a0作為單個字符,\\ ud83d \\ ude0b作為對。 我有可以提取單個代碼的正則表達式,但不能配對以匹配完整的表情符號: 有沒有一種清晰的方法來解釋一個句子中的任何/多個表情 ...