0

背景:

我正在处理 Web 应用程序的遗留代码,我目前正在将代码的一些 ASCII 部分转换为 UNICODE。我在记录器中遇到了以下错误。似乎字符串文字要么被创建,要么由于某种原因在此过程中被破坏。

示例以下字符串 -"%s::%s - Started with success."在内存中它看起来像这样。

2AF9BFC   25 00 73 00 3A 00 3A 00  %.s.:.:.
02AF9C04  25 00 73 00 20 00 2D 00  %.s. .-.
02AF9C0C  20 00 53 00 74 00 61 00   .S.t.a.
02AF9C14  72 00 74 00 65 00 64 00  r.t.e.d.
02AF9C1C  20 00 77 00 69 00 74 00   .w.i.t.
02AF9C24  68 00 20 00 73 00 75 00  h. .s.u.
02AF9C2C  63 00 63 00 65 00 73 00  c.c.e.s.
02AF9C34  73 00 2E 00 00 00 00 00  s.......
02AF9C3C  00 00 00 00 00 00 00 00  ........

在日志中,字符串将如下所示 -_S_t_a_r_t_e_d_ _w_i_t_h _s_u_c_c_e_s_s 此处的空格照常表示,NULL 字符由 _ 表示(_ 只是一个示例,不同的 txt 编辑器将以不同的方式显示它)。

我确实使用了 _T 宏,它将字符串替换为我在这里学到的 Unicode 。

为什么我得到字节 0 前缀?

4

1 回答 1

1

在 Microsoft 的术语中,“Unicode”表示UTF-16 ,即每个字符由一个或两个 16 位代码单元表示。当 ASCII 字符转换为 UTF-16 时,它将被表示为单个代码单元,其中高字节为零,低字节包含 ASCII 字符。

如果您希望日志文件以 ASCII 格式读取,则需要在写出时将文本转换为 UTF-8。否则,请确保日志文件中的所有文本都是 UTF-16 并使用理解 UTF-16 的日志文件阅读器,但请注意,如果您的大部分文本是 ASCII(因为每秒字节将为 0)。

于 2012-10-25T10:09:37.413 回答