5

晚上好,我希望你能帮助我解决这个问题,因为我正在努力寻找解决方案。

我有一个单词提供者,他给我希伯来语元音单词,例如 -

元音 - בַּיִת 不元音 - בית

元音 - הַבַּיְתָה 不元音 - הביתה

与我的提供者不同,我的用户通常不能输入希伯来元音(我也不希望他这样做)。用户故事是用户在提供的单词中寻找单词。问题是元音词和非元音词之间的比较。由于每个都由内存中的不同字节数组表示,因此 equals 方法返回 false。

我尝试研究 UTF-8 如何处理希伯来元音,它似乎只是普通字符。

我确实想将元音呈现给用户,所以我想将字符串原样保留在内存中,但是在比较时我想忽略它们。有什么简单的方法可以解决这个问题吗?

4

2 回答 2

6

您可以使用Collat​​or。我不能告诉你它是如何工作的,因为它对我来说是新的,但这似乎可以解决问题:

public static void main( String[] args ) {
    String withVowels = "בַּיִת";
    String withoutVowels = "בית";

    String withVowelsTwo = "הַבַּיְתָה";
    String withoutVowelsTwo = "הביתה";

    System.out.println( "These two strings are " + (withVowels.equals( withoutVowels ) ? "" : "not ") + "equal" );
    System.out.println( "The second two strings are " + (withVowelsTwo.equals( withoutVowelsTwo ) ? "" : "not ") + "equal" );

    Collator collator = Collator.getInstance( new Locale( "he" ) );
    collator.setStrength( Collator.PRIMARY );

    System.out.println( collator.equals( withVowels, withoutVowels ) );
    System.out.println( collator.equals( withVowelsTwo, withoutVowelsTwo ) );
}

由此,我得到以下输出:

These two strings are not equal
The second two strings are not equal
true
true
于 2012-10-06T20:37:52.300 回答
1

AFAIK 没有。元音是字符。甚至某些字母和点的组合也是字符。请参阅维基百科页面。

http://en.wikipedia.org/wiki/Unicode_and_HTML_for_the_Hebrew_alphabet

您只能将单词的搜索关键字存储为 05dx-05ex 范围内的字符。您可以为带有元音的单词添加另一个字段。

当然,您应该期待以下内容:

  • 根据 nikkud,您应该需要考虑具有不同含义的单词。
  • 您应该考虑到 י 和 ו 的“拼写错误”,这是司空见惯的。
于 2012-10-06T20:39:25.817 回答