0

我想知道 C 中的 toupper() 函数是如何工作的。我正在下面的代码中尝试它,但我肯定做错了什么。代码编译,但传递给 toupper() 的参数没有被大写......

char **copyArgs(int argc, char **argv) {
    char **a = malloc(sizeof(char *) * (argc));

    int i;
    for(i = 0; i < argc; i++) {
        int size = strlen(argv[i]);
        a[i] = malloc(sizeof(char) * (size + 1));
        strcpy(a[i], argv[i]);
        a[i] = toupper(a[i]);
    }
    return a;
}

如果我用“一二”测试它,结果是“一二”,而不是“一二”。任何建议表示赞赏。

4

1 回答 1

5

toupper将单个字母转换为大写。在您的情况下,您传递的是指向它的指针,而不是char感谢 C 在隐式转换中的宽恕,因此很明显它不能正常工作。可能您会收到“无强制转换的整数转换隐式指针”警告:这是一个强烈的信号,表明您做错了事。

整个事情不会仅仅因为在您的平台int上与指针一样大(或者,至少对于您正在使用的那些指针足够大);toupper试图将其解释int为一个字符,发现它是非字母的,并原封不动地返回它。这真是太幸运了,在其他平台上,您的程序可能会崩溃,因为指向int转换的指针被截断,并且因为范围toupper之外的整数unsigned char(加号EOF)的行为是未定义的。

要将整个字符串转换为大写,您必须遍历其所有字符并调用toupper它们中的每一个。您可以轻松编写执行此操作的函数:

void strtoupper(char *str)
{
    while(toupper((unsigned char)*str++))
        ;
}

请注意强制unsigned char转换 - 所有处理字符分类和转换的 C 函数都需要an intthat EOF(保持不变)或者是 an 的值unsigned char。原因是悲伤和复杂的,我已经在另一个答案中详细说明了。

尽管如此,值得注意的是,toupper 在设计上不能可靠地使用多字节字符编码(例如 UTF-8),因此它在现代文本处理中没有真正的位置(因为通常大多数 C 语言环境设施,它们(糟糕)设计在另一个时代)。

于 2013-02-24T23:24:42.343 回答