-1

我想要/需要一个测试用例来测试/破坏 UTF-32 和 UTF-16 之间的转换。

对于 UTF-8 和 UTF-16,我一般使用 'Chinese Bone' 测试:0xE9 0xAA 0xA8 (UTF8) 和 0x9AA8 (UTF16)。

有没有人有一个负面的测试用例应该破坏 UTF-16 和 UTF-32 的编写不佳的实现?理想情况下,测试将需要使用至少两个 UTF-32 值。

杰夫

4

1 回答 1

1

不知道你的意思,这里有一些:

UTF-16

  • 带领代理人与常规单位或其他主要代理人跟随\xD8\x00\x00\x00\xD8\x00\xDB\xFF
  • 在它之前没有前导代理的跟踪代理\x00\x61\xDC\00
  • 领先位置的跟踪代理\xDF\xFF\xDB\xFF
  • 铅替代品作为最后一个单位\xD8\x01<EOF>
  • 引导代理作为最后一个单元,然后是半步代理。此错误存在于 python 2.7.3 中:'\xD8\x00\xDC'.decode('utf-16be')

UTF-32

  • 单位值返回truevalue < 0value > 0x10FFFF0xD800 <= value && value <= 0xDFFF
于 2013-03-24T17:34:18.407 回答