2

假设您拥有的只是二进制数据并且没有预装函数,那么是否有一种模式或算法来对字符类型进行分类?

4

3 回答 3

8

您要求 API 告诉您。在 Java 中,您使用 Character 类。在 C++ 中,您可以使用 ICU。如果您的语言没有这个,您可以从 unicode.org 下载属性数据库并将其合并。

换句话说,没有模式或算法。Unicode 联盟发布了包含该信息的表格。

于 2010-01-02T19:40:09.200 回答
1

不,没有模式。您将需要创建一些查找表。(好吧,我想你可以用ifs 的迷宫来做到这一点,但这不会很好。)

幸运的是,在大多数环境中,都有一个预制的 API 函数可以为您完成,因为构建字符类数据表非常无聊。

于 2010-01-02T19:41:45.390 回答
1

我最近发布了我的 FOSS Unicode 转换器,我正在使用最新的 Unicode 字符数据库(附件 #44 - 包含 Unicode 5.2)

在这个(XML)数据库中,您可以搜索您请求的字符(十六进制代码)并查看它是数字还是您想要的任何字符。

你可以测试这个 atmy 项目,如果它有用,你可以使用它的数据库

http://unicode.codeplex.com是该项目的主要存储库。您可以只查看代码或在那里获取可执行文件

于 2010-01-04T15:13:25.500 回答