可能重复:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n 或从 unicode 字符中删除变音符号
如何从字符串中删除变音符号?
例如,转换所有适用于所有语言的 á->a、č->c 等。
我正在进行全文搜索,并且需要忽略搜索文本上的任何变音符号。
谢谢
可能重复:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n 或从 unicode 字符中删除变音符号
如何从字符串中删除变音符号?
例如,转换所有适用于所有语言的 á->a、č->c 等。
我正在进行全文搜索,并且需要忽略搜索文本上的任何变音符号。
谢谢
使用 API 级别 9+,您可以使用Normalizer类,例如
String normalized = Normalizer.normalize("âbĉdêéè", Form.NFD)
.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
(Keysers 链接的答案看起来更好,它清除了更多的废话)
这将返回"abcdeee"
。