[英]Confusion About Array and String in C
S1
, S2
和S3
什么区别?
char S1[6];
S1[0] = 'A';
S1[1] = 'r';
S1[2] = 'r';
S1[3] = 'a';
S1[4] = 'y';
char S2[6] = {'A','r','r','a','y'};
string S3 = "Array";
当我使用if (strcmp(a,b) == 0)
运行程序时,其中a, b = S1, S2, S3
。 它表明S2
和S3
是相同的, S1
和S2
是不同的。 这是为什么? 为什么不是这三个都是等价的?
当我将'\\0'
加回到S1b
, S1c
。 所有3都是一样的。 这是可以理解的。
但为什么在我的第一次试验中, S2
和S3
是相同的? 我也没有包含'\\0'
。 我怀疑S1
和S2
应该是相同的,但不是S2
和S3
。
谁能告诉我为什么我的想法是错的???
谢谢你的回答。 我已尝试将设置更改为以下内容:
char S1[5];
S1[0] = 'A';
S1[1] = 'r';
S1[2] = 'r';
S1[3] = 'a';
S1[4] = 'y';
char S2[5] = {'A','r','r','a','y'};
string S3 = "Array";
现在显然S2
和S3
不一样,因为它们的差异为'\\0'
。 但是,如果我使用strcmp来比较两者,那么为什么S1
和S2
再次不一样,我仍然有点困惑?
比较数组的实际内存中值:
{,}
语法时,任何额外元素都归零。 所以char foo[5] = { 1, 2 }
与char foo[5] = { 1, 2, 0, 0, 0}
char foo[5] = { 1, 2 }
相同。 char
(或wchar_t
)数组,其中一个额外的元素设置为\\0
(空终止符)。 视觉:
S1 = 0x41, 0x72, 0x72, 0x61, 0x79, 0x??
S2 = 0x41, 0x72, 0x72, 0x61, 0x79, 0x00
S3 = 0x41, 0x72, 0x72, 0x61, 0x79, 0x00
请注意,您遇到了strcmp
的安全问题:它没有长度参数,它会一直搜索,直到遇到\\0
,这可能永远不会(即直到它导致段错误或访问冲突)。 而是使用更安全的函数,如strncmp
或(如果使用C ++) std::string
类型。
It shows that S2 and S3 are the same, and S1 and S2 is different.
S3包含S1没有的nul终结符。 这个string S3 = "Array";
手段
| A | r | r | a | y | \0 |
虽然S2是
| A | r | r | a | y | \0 |
虽然S1是
| A | r | r | a | y | Garbage |
S1和S2比较可以导致UB(我推测),因为S1不是nul终止的,并且没有我们在strcmp
传递的长度。
#include <stdio.h>
#include <string.h>
int main(void)
{
char S1[6];
S1[0] = 'A';
S1[1] = 'r';
S1[2] = 'r';
S1[3] = 'a';
S1[4] = 'y';
S1[5] = 0;
char S2[6] = {'A','r','r','a','y', 0};
printf("%d" ,strcmp(S1,S2));
return 0;
}
输出:
0
strcmp()函数开始比较每个字符串的第一个字符。 如果它们彼此相等,则继续使用以下对,直到字符不同或直到达到终止空字符。
我不认为使用它来比较S1和S2是安全的。 输入到strcmp是第一个字符的地址。 S1不是以空值终止的。 虽然在两种情况下都分配了6个字节,但S1 [5]未初始化。 有可能他们有一些垃圾价值。 这里的风险是strcmp最终还会在搜索字符diff或null字符时比较未分配的内存。 这甚至可能导致seg故障或访问冲突。
可视化S1,S2,S3的内存对齐可能是这样的
S1 = A | r | r | a | y | ?
S2 = A | r | r | a | y | 0
S3 = A | r | r | a | y | 0
S2和S3之间的任何比较都是安全的。 S1 vs S2或S3可能不是。
只需添加现有答案
char S2[6] = {'A','r','r','a','y'};
string S3 = "Array";
两者都是NULL终止,因此strcmp()
运行良好,并说它们都是相同的。 而对于S1
,分配是明确完成的,此阵列没有NULL终止。 所以这不是C中的有效字符串。因此使用strcmp()
可能会导致未定义的行为。
S3
的要点是S3是一个只读的字符串文字。 大多数情况下,这些值存储在只读位置。 因此,当您在初始化后尝试向S3
写入内容时,您可能会看到崩溃。所以我们应该在使用S3
分配时牢记这一点。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.