簡體   English   中英

為什么Node.js將BOM字符轉換為0xFE 0xFF?

[英]Why does Node.js convert BOM character to 0xFE 0xFF?

我一直在使用node的fs.readFileSync() ,傳遞"utf8"作為讀取輸入的編碼。 當文件包含UTF8(0xEF 0xBF 0xBB)中的BOM字符時 ,它將其轉換為字節序列0xFE 0xFF,這是Unicode編碼。

為什么這樣做? 為什么不在UTF8中保留BOM的原始序列?

BOM是字符U + FEFF。 0xEF 0xBB 0xBF是其UTF-8表示。 但是通過使用utf8的編碼進行讀取,您將解碼 UTF-8。 在這一點上,談論“字節序列”變得毫無意義; 你有一串字符 ,第一個是U + FEFF。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM