我目前遇到了我认为是一项简单任务的麻烦。
如果我有一个像这样的字符串:
第 1 句“双引号短语” 第 1 句。第 2 句?第 3 句(括号中的数字,如 1.2 不应拆分)。句子 4 ' 单引号短语。其余的引用“第 4 句。第 5 句!
我想把它分成:
第 1 句“双引号短语”第 1 句。
第2句?
第 3 句(括号中的数字,如 1.2 不应拆分)。
句子 4 ' 单引号短语。引用的其余部分”第 4 句。
第五句!
显然,简单的"\.|\?|!"
匹配是行不通的。任何帮助表示赞赏。
我意识到正则表达式可能不是最好的工具,但除非我缺少另一个快速简单的解决方案,否则我已经过了不归路。