我有一个字符串变量,它是一个包含英语和日语单词的段落。我想把日语和英语分开。
所以我使用Unicode来决定字符是否落入\u+0000~ \u+007F(基本拉丁语unicode)
但我不知道如何编写将 char 转换为 unicode 的 Java 代码,以及如何比较 unicode。
任何人都可以给我一个样品吗?
public void split(String str){
char[]cstr=str.toCharArray();
String en = "";
String jp = "";
for(char c: cstr){
//(1) To Unicode?
//(2) How to check whether fall into \u0000 ~ \u007F
if(is_en) en+=c;
else jp+=c;
}
}