簡體 English 中英

C ++ 11：普通字符串文字和UTF-8字符串文字之間的區別示例？

[英]C++11: Example of difference between ordinary string literal and UTF-8 string literal?

原文 2013-02-04 02:42:18 8 1 c++/ utf-8/ character-encoding/ c++11/ string-literals

不以encoding-prefix開頭的字符串文字是普通的字符串文字，並使用給定的字符進行初始化。

以u8開頭的字符串文字，例如u8“asdf”，是一個UTF-8字符串文字，並使用UTF-8編碼的給定字符進行初始化。

我不明白普通字符串文字和UTF-8字符串文字之間的區別。

有人可以提供一個他們不同的情況的例子嗎？ （導致不同的編譯器輸出）

（我的意思是從標准的POV，而不是任何特定的實現）

字符文字或字符串文字中的每個源字符集成員，以及字符文字或非原始字符串文字中的每個轉義序列和通用字符名稱，都將轉換為執行字符集的相應成員。

1 個解決方案

C和C ++語言在其實現中允許大量的自由度。 在UTF-8是“以單字節編碼文本的方式”之前很久就編寫了C：不同的系統具有不同的文本編碼。

那么C和C ++中字符串的字節值究竟取決於編譯器。 'A'是編譯器為字符A選擇的編碼，可能與UTF-8不一致。

C ++增加了編譯器必須支持真正的UTF-8字符串文字的要求。 u8"A"[0]的位值由C ++標准通過UTF-8標准確定，無論編譯器所針對的平台的首選編碼如何。

現在，就像大多數平台C ++目標使用2的補碼整數一樣，大多數編譯器都具有大多數與UTF-8兼容的字符編碼。 因此，對於像"hello world"這樣的字符串， u8"hello world"幾乎肯定會是相同的。

舉一個具體的例子，來自man gcc

-fexec-字符集的字符集=

設置執行字符集，用於字符串和字符常量。 默認值為UTF-8。 charset可以是系統的iconv庫例程支持的任何編碼。

-finput-字符集的字符集=

設置輸入字符集，用於從輸入文件的字符集轉換為GCC使用的源字符集。 如果區域設置未指定，或GCC無法從區域設置獲取此信息，則默認值為UTF-8。 這可以通過語言環境或此命令行選項覆蓋。 目前，如果存在沖突，命令行選項優先。 charset可以是系統的iconv庫例程支持的任何編碼。

是一個能夠更改C / C ++的執行和輸入字符集的示例。

為什么C11或C ++ 11中沒有ASCII或UTF-8字符文字？

[英]Why is there no ASCII or UTF-8 character literal in C11 or C++11?

字符串文字串聯的正確行為（C ++ 11翻譯階段6）

[英]Correct behavior for string literal concatenation (C++11 phase 6 of translation)

避免 C++11 原始字符串文字中的第一個換行符？

[英]avoiding the first newline in a C++11 raw string literal?

C++11 中是否需要 u8 字符串文字

[英]Is the u8 string literal necessary in C++11

在 C++17 和 C++20 之間可移植地使用 UTF-8 字符串文字前綴

[英]Using UTF-8 string-literal prefixes portably between C++17 and C++20

如何在Visual C ++ 2008中創建UTF-8字符串文字

[英]How to create a UTF-8 string literal in Visual C++ 2008

utf-8 中 std::string 的子字符串？ C++11

[英]Substring of a std::string in utf-8? C++11

C11 / C ++ 11宏，用於將常量字符串與文字整數相關聯

[英]C11/C++11 macro to associate a constant string to a literal integer

C++11：文字 7 是純右值？

[英]C++11: literal 7 is a prvalue?

如何正確地將 u8 字符串文字傳遞給接受 UTF-8 字符串的 C 函數

[英]How to properly pass u8 string literal to C function accepting UTF-8 string

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為什么C11或C ++ 11中沒有ASCII或UTF-8字符文字？字符串文字串聯的正確行為（C ++ 11翻譯階段6）避免 C++11 原始字符串文字中的第一個換行符？ C++11 中是否需要 u8 字符串文字在 C++17 和 C++20 之間可移植地使用 UTF-8 字符串文字前綴如何在Visual C ++ 2008中創建UTF-8字符串文字 utf-8 中 std::string 的子字符串？ C++11 C11 / C ++ 11宏，用於將常量字符串與文字整數相關聯 C++11：文字 7 是純右值？如何正確地將 u8 字符串文字傳遞給接受 UTF-8 字符串的 C 函數

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM