我有一个非常大(数百万行)的应用程序,它是使用 MBCS(代码页 1252)开发的,并假设所有字符串都是 char* 并且每个字符只有一个字节。我们现在正在扩展我们的语言集,需要迁移到 Unicode。由于 UTF-8 以 1 字节为增量工作,因此这似乎很合适。按照惯例,我们希望以最少的代码更改来进行此更改。我们不希望将所有内容都更改为 wchar 或 _TCHAR,如果我们可以提供帮助,我们必须修改每个源文件的编码方式。
使用这些外来字符的唯一方法是用户在字段中输入它们,例如名称。然后根据需要将包含这些字符的字符串保存到文件中并且不进行操作。稍后读取文件并显示内容。假设源代码中没有使用 cp1252 以外的字符(即汉字等),我们是否需要对大部分源代码进行任何更改,或者我们可以将其保留为 char* 并让可能的 multi -byte 字符通过系统直到它们到达显示它们的 UI?
该应用程序是在 Visual Studio 2015 上使用 MFC 开发的。