將unicode轉換為char

Question

如何在Embarcadero C ++ 中將 Unicode字符串轉換為char*或char* const ？

Answer 1

String text = "Hello world";
char *txt = AnsiString(text).c_str();

Older text.t_str() is now AnsiString(String).c_str()

Answer 2

“ Unicode字符串”確實還不夠具體，無法知道您的源數據是什么，但是您可能的意思是“ UTF-16字符串存儲為wchar_t數組”，因為這是大多數不了解正確術語的人所使用的。

盡管“ embarcadero”有一些約定，但“ char *”也不足以知道您要定位的目標。 除非另有說明，否則我將假設您需要UTF-8數據。

我也將我的例子限制在VS2010中

// your "Unicode" string
wchar_t const * utf16_string = L"Hello, World!";

// #include <codecvt>
std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>,wchar_t> convert;

std::string utf8_string = convert.to_bytes(utf16_string);

假設wchar_t字符串與Windows一樣是UTF-16，否則是可移植代碼。

Answer 3

您可以合法地將任何數組重新解釋為char指針的數組。 因此，如果您的Unicode數據采用4字節代碼單位，例如

char32_t data[100];

那么您可以將其作為char數組進行訪問：

char const * p = reinterpret_cast<char const*>(data);

for (std::size_t i = 0; i != sizeof data; ++i)
{
    std::printf("Byte %03zu is 0x%02X.\n", i, p[i]);
}

這樣，您可以一一檢查Unicode數據的各個字節。

（當然，這與轉換文本的編碼無關。為此，請使用諸如iconv或ICU之類的庫。）

Answer 4

如果您使用Windows：

//#include <windows.h>
u16string utext = u"объява";
char text[0x100];
WideCharToMultiByte(CP_UTF8,NULL,(const wchar_t*)(utext.c_str()),-1,text,-1,NULL,NULL);
cout << text;

我們不能使用std :: wstring_convert，因此在MinGW 4.9.2中不可用。

將unicode轉換為char

問題描述

4 個解決方案

解決方案1
4 2012-10-19 05:54:36

解決方案2
2 已采納 2012-06-14 20:36:47

解決方案3
1 2012-06-14 20:17:53

解決方案4
0 2015-11-02 20:54:55

將unicode轉換為char

問題描述

4 個解決方案

解決方案1 4 2012-10-19 05:54:36

解決方案2 2 已采納 2012-06-14 20:36:47

解決方案3 1 2012-06-14 20:17:53

解決方案4 0 2015-11-02 20:54:55

解決方案1
4 2012-10-19 05:54:36

解決方案2
2 已采納 2012-06-14 20:36:47

解決方案3
1 2012-06-14 20:17:53

解決方案4
0 2015-11-02 20:54:55