我正在寻找一个示例文本 unicode 文件 (UTF-8),可用于测试与文本编码和解码相关的不同问题,包括:
- 低 ascii 字符使用率,例如前 32 个代码
- BMP 以外的字符
- NFC 相关问题
- XML 编码/解码问题
主要是我想将文本复制到剪贴板,将其粘贴到应用程序的 HTML 文本区域中,然后能够从页面中检索它。
这将能够识别可能在解码、编码甚至数据库级别发生的不同 Unicode 相关问题。
我正在寻找一个示例文本 unicode 文件 (UTF-8),可用于测试与文本编码和解码相关的不同问题,包括:
主要是我想将文本复制到剪贴板,将其粘贴到应用程序的 HTML 文本区域中,然后能够从页面中检索它。
这将能够识别可能在解码、编码甚至数据库级别发生的不同 Unicode 相关问题。
此页面已用于测试 Web 浏览器,其中包含多个脚本中的文本:https ://www.kermitproject.org/utf8.html
特别是“我可以吃玻璃”的哥特式条目在 BMP 之外: ̈, .
规范化表单和 XML 处理在移动数据时通常不会出现问题,因此没有专门测试这两者的通用示例。