8

可能重复:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n 或从 unicode 字符中删除变音符号

如何从字符串中删除变音符号?

例如,转换所有适用于所有语言的 á->a、č->c 等。

我正在进行全文搜索,并且需要忽略搜索文本上的任何变音符号。

谢谢

4

1 回答 1

20

使用 API 级别 9+,您可以使用Normalizer类,例如

String normalized = Normalizer.normalize("âbĉdêéè", Form.NFD)
    .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");

(Keysers 链接的答案看起来更好,它清除了更多的废话)

这将返回"abcdeee"

于 2012-05-22T10:14:13.813 回答