java - Java 6 RegEx 匹配所有不在 Unicode 字母和标记类别中的字符

Question

我需要从字符串中删除所有非字母和标记（Unicode 类别）字符。目前我正在拆分并随后加入一个字符串，如下所示：

text.split("[\\p{P} \\t\\n\\r]")

然而，我的正则表达式......严重不足。请帮忙。

编辑我认为这会起作用：

text.split("[\\P{M}\\P{L}]")

score 3 · Accepted Answer

试试这个：

text = text.replaceAll("[^\\p{L}\\p{M}]", "");

1 回答 1