我正在尝试收集印地语字符集中所有类似“o”的形状的 Unicode 列表。事实上,使用单独的字符来表示重音的任何字符(任何语言)的列表会更好。
我打算在 RegExp 中使用这个 unicode-list。
我一直在尝试通过在输入文本字段中输出它们来编辑字符范围列表,但是编辑此文本会导致奇怪的问题(键盘光标没有放在正确的字符上,选择突然消失/错误地扭曲......在换句话说……印地语地狱!)
我也用 Notepad++ 试过这个,但虽然它反应更快,但它最终还是像在 Flash Player 文本字段中那样对我产生了影响。这似乎尤其是在删除 [] 块(空值?)字符时发生。其中一些会引发奇怪的行为。
无论如何,我想要的只是一个口音列表。一些例子如下图所示(但我需要所有口音):
谢谢!