我正在尝试将Gujarati
(一种Indian
语言)单词标记为字符。
示例:વાનર 是单词,然后我想要 [વા, ન, ર] 等字符列表
我试过java.text.BreakIterator
了,Gujarati
locale
但没有用。虽然它非常适用于Hindi
.
这是代码:
import java.text.*;
import java.util.*;
public class Language{
public static void main(String[] args) {
String text = "વાનર";
Locale gujarati = new Locale("gu","IN");
BreakIterator breaker = BreakIterator.getCharacterInstance(gujarati);
breaker.setText(text);
int start = breaker.first();
for (int end = breaker.next(); end != BreakIterator.DONE; start = end, end = breaker.next()) {
System.out.println(text.substring(start,end));
}
}
}
输出:
વ
ા
ન
ર
是否有任何图书馆可以正确地做到这一点?我对其他语言很好Java