我正在寻找一个小型 C 库来处理 utf8 字符串。
具体来说,基于 unicode 分隔符的拆分用于词干算法。
相关帖子建议:
ICU http://www.icu-project.org/(我发现它对于我在嵌入式设备上的用途来说太笨重了)
UTF8-CPP:http ://utfcpp.sourceforge.net/ (非常好,但 C++ 不是 C)
有没有人找到任何独立于平台的小型代码库库来处理 unicode 字符串(不需要进行归化)。
我正在寻找一个小型 C 库来处理 utf8 字符串。
具体来说,基于 unicode 分隔符的拆分用于词干算法。
相关帖子建议:
ICU http://www.icu-project.org/(我发现它对于我在嵌入式设备上的用途来说太笨重了)
UTF8-CPP:http ://utfcpp.sourceforge.net/ (非常好,但 C++ 不是 C)
有没有人找到任何独立于平台的小型代码库库来处理 unicode 字符串(不需要进行归化)。
我成功使用的一个漂亮、轻便的库是utf8proc。
还有MicroUTF-8,但它可能需要登录凭据才能查看或下载源代码。
UTF-8 是专门设计的,因此许多面向字节的字符串函数可以继续工作或只需要稍作修改。
strstr
例如,只要 C 的两个输入都是有效的、以 null 结尾的 UTF-8 字符串,C 的函数就可以完美运行。strcpy
只要其输入字符串从字符边界开始(例如 的返回值strstr
),它就可以正常工作。
因此,您甚至可能不需要单独的库!