4

我正在寻找一个示例文本 unicode 文件 (UTF-8),可用于测试与文本编码和解码相关的不同问题,包括:

  • 低 ascii 字符使用率,例如前 32 个代码
  • BMP 以外的字符
  • NFC 相关问题
  • XML 编码/解码问题

主要是我想将文本复制到剪贴板,将其粘贴到应用程序的 HTML 文本区域中,然后能够从页面中检索它。

这将能够识别可能在解码、编码甚至数据库级别发生的不同 Unicode 相关问题。

4

1 回答 1

8

此页面已用于测试 Web 浏览器,其中包含多个脚本中的文本:https ://www.kermitproject.org/utf8.html

特别是“我可以吃玻璃”的哥特式条目在 BMP 之外: ̈, .

规范化表单和 XML 处理在移动数据时通常不会出现问题,因此没有专门测试这两者的通用示例。

于 2013-05-13T12:21:48.303 回答