3

也许我遗漏了一些明显的东西,但是有没有一种“无痛”的方法可以用不带重音的对应物替换给定文本中的重音字母?我只能使用标准的 ANSI C 库/头文件,所以我束手无策。到目前为止我已经尝试过:

unsigned char currentChar;

(...)

if (currentChar == 'à') { 
    currentChar = 'a'; 
}
else if (currentChar == 'è' || currentChar == 'é') {
    currentChar = 'e'; 
}
else if (...)

但是,这不起作用。检测带有扩展 ASCII 值的重音元音也不是一种选择,因为我注意到它会根据系统区域设置而变化。

任何提示/建议?

(更新)

感谢您的回答,但我并没有真正要求解决这个问题的最佳方法 - 我稍后会考虑。我只是在寻求一种检测重音元音的方法,因为上面的代码只是忽略了它们。

(更新#2)

好的。让我澄清一下:

#include <stdio.h>

int main(void) {
    int i;
    char vowels[6] = {'à','è','é','ì','ò','ù'};
    for (i = 0; i < 6; i++) {
        switch (vowels[i]) {
            case 'à': vowels[i] = 'a'; break;
            case 'è': vowels[i] = 'e'; break;
            case 'é': vowels[i] = 'e'; break;
            case 'ì': vowels[i] = 'i'; break;
            case 'ò': vowels[i] = 'o'; break;
            case 'ù': vowels[i] = 'u'; break;
        }
     }
     printf("\n");
     for (i = 0; i < 6; i++) {
         printf("%c",vowels[i]);
     }
     printf("\n");
     return 0;
}

此代码仍然打印“àèéìòù”作为其输出。这是我的问题。我很欣赏这些答案,但是告诉我实现转换映射或 switch/case 结构是没有意义的。我以后会考虑的。

4

4 回答 4

3

重音字符可能是 UTF-8 字符集或其他编码的一部分。您的程序正在使用该char类型,该类型通常使用ASCII 字符集

在 ASCII 字符集中,每个字符由一个字节表示。此字符集不包括重音字符。

其他编码确实包含该字符,但它可能不是由单个字节表示,因此无法由您的代码处理。解决这个问题的方法通常是使用宽字符。

您需要的是宽字符

这个问题可能有更一般的解释。

这个问题可能会为您的情况提供解决方案。

这段代码似乎做你想做的事:

#include <stdio.h>
#include <wchar.h>
#include <locale.h>
int main(int argc, char **argv){
    setlocale(LC_CTYPE, "");
    FILE *f = fopen(argv[1], "r");
    if (!f)
        return 1;

    for (wchar_t c; (c = fgetwc(f)) != WEOF;){
        switch (c) {
            case L'à': c=L'a'; break;
            case L'è': c=L'e';break;
            case L'é': c=L'e';break;
            case L'ì': c=L'i';break;
            case L'ò': c=L'o';break;
            case L'ù': c=L'u';break;
            default:    break;
        }
        wprintf(L"%lc", c);
    }

    fclose(f);
    return 0;
}
于 2012-11-05T19:11:22.307 回答
1

可能有一种更简单的方法,一些我没有听说过的现有功能,但就结构而言,这就是我的处理方式:

建立一个由重音字符和结果字符组成的字符转换表。然后构建一个简单的循环来扫描表中的每个字符,如果找到,则进行更改。

于 2012-11-05T18:53:45.857 回答
1

如果你写

if ( currentChar == (unsigned char)('è'))...

鉴于您仅使用 std c 库的限制,您的方法应该有效,我看不出您是如何将其拉下来的。

于 2012-11-05T19:13:38.233 回答
1

让我们试试这个:

char p_RemoveAccent(char C)
{
    #define ACCENT_CHARS    "ÁÀÃÂÇáàãâçÉÊéêÍíÑÓÔÕñóôõÚÜúü"
    #define UNACCENT_CHARS  "AAAACaaaacEEeeIiNOOOnoooUUuu"

    const char *p_Char = memchr(ACCENT_CHARS, C, sizeof(ACCENT_CHARS));

    return (p_Char ? UNACCENT_CHARS[(p_Char - ACCENT_CHARS)] : C);
}
于 2016-04-04T18:00:48.957 回答