我有一个包含一些泰米尔语字符的 javascript 字符串。我需要将它们拆分为单独的 unicode 字符。split 方法不理解http://en.wikipedia.org/wiki/Complex_text_layout复杂的文本布局。
例如:
在 "கதிரவன்" 上调用 split("") 返回:
,க,த,ி,ர,வ,ன,்</p>
当我预期:
க,தி,ர,வ,ன்
应该怎么做才能正确地从字符串中拆分 unicode 字符?
编辑:我可以在浏览器(chrome)中很好地浏览这些字母。我正在尝试在 chrome 扩展中使用这个 js。因此,如果也有特定于 chrome 的解决方案,我很好。