使用 split() 时,什么正则表达式可以让我保留所有单词字符,但也可以保留像 don't won't 这样的缩写。撇号两侧带有单词字符但删除任何前导或尾随撇号的任何内容,例如“tis or dogs”。
我有:
String [] words = line.split("[^\\w'+]+[\\w+('*?)\\w+]");
但它保留了前导和尾随标点符号。
的输入'Tis the season, for the children's happiness'.
将产生以下输出:Tis the season for the children's happiness
有什么建议吗?