4

如何将 UTF-8 char* 中的字符串转换为 CString?

4

3 回答 3

5
bool Utf8ToCString( CString& cstr, const char* utf8Str )
{
    size_t utf8StrLen = strlen(utf8Str);

    if( utf8StrLen == 0 )
    {
        cstr.Empty();
        return true;
    }

    LPTSTR* ptr = cstr.GetBuffer(utf8StrLen+1);

#ifdef UNICODE
    // CString is UNICODE string so we decode
    int newLen = MultiByteToWideChar(
                     CP_UTF8,  0,
                     utf8Str, utf8StrLen,  ptr, utf8StrLen+1
                     );
    if( !newLen )
    {
        cstr.ReleaseBuffer(0);
        return false;
    }
#else
    WCHAR* buf = (WCHAR*)malloc(utf8StrLen);

    if( buf == NULL )
    {
        cstr.ReleaseBuffer(0);
        return false;
    }

    int newLen = MultiByteToWideChar(
                     CP_UTF8,  0,
                     utf8Str, utf8StrLen,  buf, utf8StrLen
                     );
    if( !newLen )
    {
        free(buf);
        cstr.ReleaseBuffer(0);
        return false;
    }

    assert( newLen < utf8StrLen );
    newLen = WideCharToMultiByte(
                     CP_ACP,  0,
                     buf, newLen,  ptr, utf8StrLen
                     );
    if( !newLen )
    {
        free(buf);
        cstr.ReleaseBuffer(0);
        return false;
    }

    free(buf);
#endif

    cstr.ReleaseBuffer(newLen);
    return true;
}

尽管此功能对 UNICODE 和非 UNICODE 配置都有效,但恕我直言,在 Win32 程序中使用 UNICODE 配置效率更高(通常在此功能中)。

于 2011-04-15T07:04:19.850 回答
4

MultiByteToWideChar使用代码页调用CP_UTF8,然后照常使用 CString。

于 2011-04-15T06:45:09.440 回答
0

如果您的字符串仅包含代码为 0 到 127 的 ASCII 字符,您可能会将 UTF-8 字符串威胁为 ASCII 字符串并用它初始化 CString:

CString my_cstr((char*)my_string);

否则(如果您的 UTF-8 字符串包含其他一些字符),您将无法轻松地从中获取 char* 字符串。

于 2011-04-15T07:03:41.277 回答