所以,我正在研究一个纯 C (ANSI 9899:1999) 项目,并试图找出从哪里开始 re:Unicode、UTF-8 和所有爵士乐。
具体来说,它是一个语言解释器项目,我有两个主要需要处理 Unicode 的地方:读取源文件(该语言表面上支持 Unicode 标识符等)和“字符串”对象。
我熟悉有关 Unicode、UTF-7/8/16/32 和 UCS-2/4 等等的所有明显基础知识……我主要是在寻找有用的、特定于 C 的(也就是说,请没有 C++ 或 C#,这是之前在 SO 上记录的所有内容)资源,关于我在 C 中实现 Unicode 友好的东西的“下一步”。
任何链接、手册页、维基百科文章、示例代码都非常受欢迎。我还将尝试在原始问题中维护此类资源的列表,以供以后遇到它的任何人使用。
- 在考虑其他任何事情之前必须阅读,如果您不熟悉 Unicode,以及编码实际上是什么: http: //www.joelonsoftware.com/articles/Unicode.html
- UTF-8 主页:http ://www.utf-8.com/
man 3 iconv
(以及iconv_open
和iconvctl
)- Unicode 的国际组件(通过Geoff Reedy)
libbasekit
,这似乎包括轻量级的 Unicode 处理工具- Glib有一些 Unicode 函数
- Christoph的基本UTF-8 检测器功能