3

根据我的代码,我假设每个希腊字符都存储在 2 个字节中。 sizeof返回每个字符的大小为4(即 sizeof int

如何strlen返回16?[让我觉得每个字符占 2 个字节](不应该是 4*8 = 32 吗?因为它计算字节数。)

另外,如何printf("%c",bigString[i]);正确打印每个字符?它不应该读取 1 个字节(一个字符)然后显示,因为%c,为什么在这种情况下希腊字符没有拆分。

strcpy(bigString,"ειδικούς");//greek
sLen = strlen(bigString);
printf("Size is %d\n ",sizeof('ε')); //printing for each character similarly
printf("%s is of length %d\n",bigString,sLen);
int k1 = 0 ,k2 = sLen - 2;

for(i=0;i<sLen;i++)
printf("%c",bigString[i]);

输出:

Size is 4
 ειδικούς is of length 16
ειδικούς
4

1 回答 1

10
  1. C 中的字符文字具有类型int,因此与 .sizeof('ε')相同sizeof(int)。你在这个声明中玩火了,有点。 'ε'将是一个多字符文字,这不是标准的,可能会回来咬你。小心使用像这样的扩展。例如,Clang 不会接受包含该文字的程序。GCC 会发出警告,但仍会编译它。

  2. strlen返回 16,因为这是字符串中空终止符之前的字节数。您的希腊字符在 UTF-8 中都是 16 位长,因此您的字符串看起来像:

    c0c0 c1c1 c2c2 c3c3 c4c4 c5c5 c6c6 c7c7 0
    

    在内存中c0c0,例如,其中 是第一个字符的两个字节。您的字符串中有一个终止字节。

  3. printf似乎可以工作,因为您的终端支持 UTF-8。您分别打印每个字节,但终端将前两个打印解释为单个字符,依此类推。如果您将该printf调用更改为:

    printf("%d: %02x\n", i, (unsigned char)bigString[i]);
    

    您将看到您所期望的逐字节行为。

于 2013-05-21T14:42:21.497 回答