cost 112 ms
為什么 Sysinternals du64.exe 在 UTF-16LE 中意外地出現 output 並帶有 BOM(注意到它在 perl 中解析 output)?

[英]Why does Systinternals du64.exe unexpectedly output in UTF-16LE with a BOM (noticed it parsing output in perl)?

在 Windows 11 的全新安裝中,運行 Strawberry perl,我正在調試解析 du64 的du64 (磁盤使用情況)的腳本。 它使用 ActiveState perl 在 Win 10 上運行。 為了調試,我首先檢查了du ,沒有參數:use strict; my $prog = ...

如何使用 iconv 或類似工具將 UTF-16BE 字符串轉換為人類可讀的字符

[英]How to use iconv or similar to convert a UTF-16BE string to human readable characters

我在UTF-16BE中有以下數據: 我正在嘗試將其轉換為人類可讀的格式,以便在 bash 腳本中進一步使用。 以上應解析為“ 3303 C92 ” 目前我已經做到了這一點,但我顯然出錯了。 命令錯誤: iconv: illegal input sequence at position 0 我正在使用 ...

UTF-16 編碼是否默認處理數據壓縮?

[英]Is UTF-16 encoding handles data compression by default?

我有 unicode char த當我將 id 轉換為數據時, UTF 8 -> 大小: 3 字節數組:[224, 174, 164] UTF 16 -> 大小: 4 字節數組:[2980] 看起來很簡單 UTF8 每個代碼占用 1 個字節,而 UTF16 每個代碼占用 4 個字節 ...

如何將 `Debug` 值直接格式化為 utf-16 字符串?

[英]How can I format a `Debug` value directly into a utf-16 string?

假設我有一個實現Debug的類型的值,我想用 utf-16 編碼格式化該值的結果。 一種方法是使用format! 然后將str轉換為 utf-16:use std::fmt::Debug; #[derive(Debug)] pub struct User { name: String, ...

2022-12-12 17:04:40   1   58    rust / utf-16  
控制台輸出中的 C++ 字符間距,UTF-16 字符

[英]C++ char spacing in console output, UTF-16 characters

我正在使用 UTF-16 字符在 C++ 控制台中制作游戲以使其更有趣,但有些字符的大小與其他字符不同。 所以,當我打印關卡時,角色之后的東西比其他東西移動得更遠。 有什么方法可以通過某些控制台功能在字符之間添加間距,我嘗試用谷歌搜索一些有用的東西,但我什么也沒找到。 我試圖通過 CONSOLE_F ...

等效於 UTF-16 的 MemorySegment.getUtf8String

[英]Equivalent of MemorySegment.getUtf8String for UTF-16

我正在使用 JDK 19 中的 Foreign Function 和 Memory API ([JEP 424][1]) 將基於 JNA 的庫移植到“純”Java。 我的庫處理的一個常見用例是從本機 memory 讀取(空終止)字符串。對於大多數 *nix 應用程序,這些是“C 字符串”並且Mem ...

我應該刪除 utf-16 編碼中的空白值嗎?

[英]Should I delete blank values in utf-16 encoding?

當我使用 Encoding.Unicode 從字符串中讀取所有字節時,它給了我空白 (0) 值。 當我運行這段代碼時: 它給了我 output 我知道這是因為 UTF-16 存儲 2 個字節而 0 只是第二個字節,但我的問題是我應該刪除 0 嗎? 因為據我所知,它們什么都不做,而且我的程序需要遍歷 ...

在具有特定 utf16 字符大小的機器上將字節數組讀入 utf16 字符

[英]Reading an array of bytes into utf16 characters on a machine with a specific utf16 character size

我對使用 openSSL 的 utf16_t 字符交互和 SHA256 生成有疑問。 問題是,我目前正在編寫應該處理密碼散列的代碼。 我已經生成了一個 256 位的 hash,我想將它放入 utf-16 編碼字符字段的數據庫中。 在我的 c++ 代碼中,我使用 char16_t 來存儲此類數據。 但 ...

JavaScript 如何將一組 integer 值的元素串起來?

[英]How is JavaScript string a set of elements of integer values?

來自MDN JavaScript 的 String 類型用於表示文本數據。 它是一組 16 位無符號 integer 值的“元素”。 String 中的每個元素在 String 中占用一個 position。 第一個元素在索引 0 處,下一個在索引 1 處,依此類推。 String 的長度是 ...

尋找將UTF8轉換為UTF16的算法的描述

[英]Looking for the description of the algorithm to convert UTF8 to UTF16

我有 3 個字節代表用 utf8 編碼的 unicode 字符。 例如,我有E2 82 AC (UTF8) 代表 unicode char € (U+20AC) 。 他們有任何算法來進行這種轉換嗎? 我知道它們是 windows api MultiByteToWideChar 但我想知道它們是否是 ...

使用 Golang 編寫 UTF-16 編碼的 CSV

[英]Write UTF-16 encoded CSV using Golang

我需要編寫一個 UTF-16 conded csv,但我不知道該怎么做。 我發現了很多關於閱讀 UTF-16 csvs 但沒有關於寫作的問題和答案。 這是我迄今為止嘗試過的: 但我在 csv 中得到以下 output: 我究竟做錯了什么? ...

python 無法讀取從 azure 開發操作 (utf-8) 下載的 csv 文件

[英]python cant read csv file downloaded from azure dev ops (utf-8)

我創建了一個 azure 開發操作查詢,並選擇了“將結果下載為 csv”,這給了我一個 csv 文件。 如果我在 vscode 中打開這個 csv,我可以在右下角UTF-8 with BOM 我正在嘗試編寫一些 python function 將讀取此 csv 文件的每個值。 我不能依賴自己解析文本 ...

如何將 char16_t 轉換為按 2 個字節划分的字符串流

[英]How to convert a char16_t into a stringstream divided with 2 bytes

我做了一個 utf8 到 utf16 的轉換,我得到了 utf16 char16_t 的代碼單元。 Output: 如果可能,我現在需要將代碼單元傳遞給字符串流,但我不知道如何將其轉換為 2 個字節,如下所示: 有什么建議么? 也許首先將其轉換為 uint8_t 向量? ...

如何在 u"..." 字符串中產生有意的編碼錯誤?

[英]How to produce intentional encoding errors in u"..." strings?

我正在編寫一個 UTF-16 解碼例程。 為了檢查它是否正常工作,我需要生成帶有故意編碼錯誤的測試字符串。 但是,當我嘗試以明顯的方式在 C 中生成此類字符串時,編譯器會拒絕我的代碼,並顯示“...不是有效的通用字符:” 如何生成帶有故意編碼錯誤的u"..."字符串? ...

為什么 JavaScript 的字符串使用 UTF-16 而一個字符的實際大小可能只有一個字節?

[英]Why is that JavaScript's strings are using UTF-16 but one character's actual size can be just one byte?

根據這篇文章: 在內部,JavaScript 源代碼被視為 UTF-16 代碼單元序列。 這個IBM 文檔說: UTF-16 基於 16 位代碼單元。 因此,每個字符可以是 16 位(2 個字節)或 32 位(4 個字節)。 但我在 Chrome 的控制台中測試,英文字母只占用 1 個字節,而不 ...

打包成c類型並取回二進制值

[英]Pack into c types and obtain the binary value back

我正在使用以下代碼將整數打包成無符號短整數,如下所示, 現在我正在嘗試按如下方式解壓縮結果。 我使用utf-16-le ,因為數據被編碼為 little-endian。 不幸的是,它會引發以下錯誤, 結果 = bin(int(bin_asc.decode("utf-16-le"), 1 ...

如何在 Python 中從二進制文件讀取和寫入“Unicode(UTF-16 little endian)”文本?

[英]How to read and write "Unicode (UTF-16 little endian)" text to and from a binary file in Python?

我有一個二進制文件“x.bin”,它是一個 Windows 可執行文件。 我正在嘗試使用 Python 修改此可執行文件中的字符串值,在文本編輯器中查看此字符串 我被告知文本編碼為“Unicode(UTF-16 little endian)”,我可以看到空字節環繞字符串中的文本。 但是,當我嘗試 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM