Unicode 有大量的代码点,我如何检查代码点是符号(如“!”或“☭”)、数字(如“4”或“৯”)、字母(如“a”或“え”)还是控制字符(通常不直接显示)?
字符的位置背后是否有任何逻辑以及它是什么类型的字符(而不是它是什么字母表的一部分),如果没有,是否有任何现有资源可以分类哪些范围是什么?
Unicode 有大量的代码点,我如何检查代码点是符号(如“!”或“☭”)、数字(如“4”或“৯”)、字母(如“a”或“え”)还是控制字符(通常不直接显示)?
字符的位置背后是否有任何逻辑以及它是什么类型的字符(而不是它是什么字母表的一部分),如果没有,是否有任何现有资源可以分类哪些范围是什么?
这将通过这些代码点的General Category 属性来完成。它是规范UnicodeData.txt
数据集的一部分,每个严肃的 Unicode 相关库都应该有一些方法可以让你获得这个属性。