可能重复:
解析单个句子的正则表达式是什么?
我想将大文本拆分成句子。我从这里的答案得到的正则表达式
string[] sentences = Regex.Split(mytext, @"(?<=[\.!\?])\s+");
所以我想使用一种模式来进行拆分,例如 a.
?
!
跟在 aspace
和一个capital
字母之后,而不是拆分。
大写字母表示句首。
text = " Sentence one . Sentence e.g. two ? Sentence three.
sentence[1] = Sentence one
sentence[2] = Sentence e.g. two
对于像缩写这样有问题的情况,我打算替换
mytext.replace("e.g.","eg");
如何在正则表达式中实现这一点?