[英]Why does Node.js convert BOM character to 0xFE 0xFF?
我一直在使用node的fs.readFileSync()
,傳遞"utf8"
作為讀取輸入的編碼。 當文件包含UTF8(0xEF 0xBF 0xBB)中的BOM字符時 ,它將其轉換為字節序列0xFE 0xFF,這是Unicode編碼。
為什么這樣做? 為什么不在UTF8中保留BOM的原始序列?
BOM是字符U + FEFF。 0xEF 0xBB 0xBF是其UTF-8表示。 但是通過使用utf8的編碼進行讀取,您將解碼 UTF-8。 在這一點上,談論“字節序列”變得毫無意義; 你有一串字符 ,第一個是U + FEFF。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.