C 字符串中的特殊字符和不可打印的 ASCII 的奇怪之处

Question

我需要将 c++ 字符串复制到 char 数组中，然后对其进行解码。 char 数组不需要被 null 终止。 由于编码的性质，许多字符是不寻常的，有些是不可打印的，这会导致问题。

这是 C++ 字符串打印为： std::cout << myString; Output：

mw\22ypwr\`himg 0few1nvnl

通过执行以下操作将其转换为char [] ：

char * m = new char[myString.size() + 1];
strcpy(m, myString.c_str());

m*的长度为 24，不正确。 它无法正确解码。 以下char []可以正确解码：

char m2 [] = "mw\22ypwr`himg 0few1nvnl";

请注意，这是通过复制字符串的 output 创建的。 但是，这个 c 字符串的长度只有 22，而不是 24。此外，打印它有以下结果：

std::cout << m;

Output：

mwypwr`himg 0few1nvnl

请注意， \22消失了。 但是，它并不像在将其转换为char[]之前从字符串中删除它那么简单。 遍历 ASCII 值显示有一个十进制操作码为18的字符，其中\22曾经是。 该字符不打印。

ASCII 值作为十进制：

109 119 18 121 112 119 114 96 104 105 109 103 32 48 102 101 119 49 110 118 110 108

为什么\22被转换为 ASCII 字符 18？ 如何从具有文字\22的 C++ 字符串构造正确的、可解码的 C 字符串？ 我需要能够为大量可能未知的编码字符串执行此操作，因此我不希望在不知道为什么会发生这种情况的情况下手动将\22替换为 ASCII 18。

Answer 1

字符串包含表示八进制字符的转义序列。

"mw\22ypwr\...other characters..."

\22是十进制 18 的八进制，因此当您显示每个字符的数字版本时，您会看到 output。

Answer 2

如果 c++ 字符串不是零终止的，那么这将不起作用

strcpy(m, myString.c_str());

strcpy 复制到零，请改用 memcpy