c - C/C++ I18N mbstowcs 问题

Question

我正在致力于国际化 C/C++ 应用程序的输入。我目前遇到了从多字节字符串转换为宽字符串的问题。

代码需要跨平台兼容，所以我尽量使用mbstowcs和wcstombs。

我目前正在使用 WIN32 机器，并且已将语言环境设置为非英语语言环境（日语）。

当我尝试转换多字节字符串时，我似乎遇到了一些转换问题。

以下是代码示例：

int main(int argc, char** argv)
{
    wchar_t *wcsVal = NULL;
    char *mbsVal = NULL;

     /* Get the current code page, in my case 932, runs only on windows */
     TCHAR szCodePage[10]; 
     int cch= GetLocaleInfo( 
             GetSystemDefaultLCID(), 
             LOCALE_IDEFAULTANSICODEPAGE,  
             szCodePage,  
             sizeof(szCodePage)); 

     /* verify locale is set */
     if (setlocale(LC_CTYPE, "") == 0)
     {
        fprintf(stderr, "Failed to set locale\n");
        return 1;
     }

    mbsVal = argv[1];
         /* validate multibyte string and convert to wide character */
    int size = mbstowcs(NULL, mbsVal, 0);
    if (size == -1)
    {
        printf("Invalid multibyte\n");
        return 1;
    }
    wcsVal = (wchar_t*) malloc(sizeof(wchar_t) * (size + 1));
    if (wcsVal == NULL)
    {
        printf("memory issue \n");
        return 1;
    }

    mbstowcs(wcsVal, szVal, size + 1);
    wprintf(L"%ls \n", wcsVal);         
    return 0;
}

执行结束时，宽字符串不包含转换后的数据。我认为代码页设置存在问题，因为当我使用 MultiByteToWideChar 并发送当前代码页时

例如：MultiByteToWideChar(CP_ACP, 0, mbsVal, -1, wcsVal, size + 1); 代替 mbstowcs 调用，转换成功。

我的问题是，如何使用通用 mbstowcs 调用而不是 MuliByteToWideChar 调用？

score 1 · Accepted Answer

在 Windows 上调用 mbstowcs 从来没有像 MultiByteToWideChar 那样好。不必费心去弄清楚这一点，只需坚持使用 Win32 API。

score 1 · Accepted Answer

如果打印返回的字符串会得到setlocale()什么？这将指示实际设置的语言环境，这可能不是您所期望的。

MSDN 指出，在 Windows 上，选择的默认语言环境""是“从操作系统获得的用户默认 ANSI 代码页”。也许这与当前的ANSI 代码页不同？

c - C/C++ I18N mbstowcs 问题

2 回答 2

Related

Reference