0

我正在尝试编写一个通用文本编辑器,它可以在 EditControl 中打开和显示 ANSI 和 Unicode。ReadFile()如果确定文本是ANSI,是否需要重复调​​用?无法弄清楚如何执行此任务。我在下面的尝试不起作用,它显示“?” EditControl 中的字符。

LARGE_INTEGER fSize;
        GetFileSizeEx(hFile,&fSize);

        int bufferLen = fSize.QuadPart/sizeof(TCHAR)+1;
        TCHAR* buffer = new TCHAR[bufferLen];       
        buffer[0] = _T('\0');

        DWORD wasRead = 0;
        ReadFile(hFile,buffer,fSize.QuadPart,&wasRead,NULL);        
        buffer[wasRead/sizeof(TCHAR)] = _T('\0');

        if(!IsTextUnicode(buffer,bufferLen,NULL))
        {                       
            CHAR* ansiBuffer = new CHAR[bufferLen];
            ansiBuffer[0] = '\0';
            WideCharToMultiByte(CP_ACP,0,buffer,bufferLen,ansiBuffer,bufferLen,NULL,NULL);
            SetWindowTextA(edit,ansiBuffer);
            delete[]ansiBuffer;
        }
        else
            SetWindowText(edit,buffer);

        CloseHandle(hFile);
        delete[]buffer;
4

1 回答 1

2

有一些缓冲区长度错误和奇怪之处,但这是你的大问题。你叫WideCharToMultiByte错了。这意味着接收 UTF-16 编码的文本作为输入。但是当IsTextUnicode返回 false 时,这意味着缓冲区不是 UTF-16 编码的。

以下基本上是您需要的:

if(!IsTextUnicode(buffer,bufferLen*sizeof(TCHAR),NULL))
    SetWindowTextA(edit,(char*)buffer);

请注意,我已将长度参数固定为IsTextUnicode.

对于它的价值,我想我会读入char. 这将消除对sizeof(TCHAR). 事实上,我会TCHAR完全停止使用。这个程序应该一直是 Unicode -TCHAR是您在为 Windows 的 NT 和 9x 变体编译时使用的程序。我想你不再为 9x 编译了。

所以我可能会这样编码:

char* buffer = new char[filesize+2];//+2 for UTF-16 null terminator
DWORD wasRead = 0;
ReadFile(hFile, buffer, filesize, &wasRead, NULL);        
//add error checking for ReadFile, including that wasRead == filesize
buffer[filesize] = '\0';
buffer[filesize+1] = '\0';
if (IsTextUnicode(buffer, filesize, NULL))
    SetWindowText(edit, (wchar_t*)buffer);
else
    SetWindowTextA(edit, buffer);
delete[] buffer;

另请注意,此代码不考虑接收 UTF-8 编码文本的可能性。如果你想处理这个问题,你需要获取缓冲区并通过usingchar发送到。MultiByteToWideCharCP_UTF8

于 2012-09-26T17:41:39.687 回答