我非常清楚这是一个不平凡的问题。
我目前有这个:
(.*?)(!,"\s|!,"$|\.\s|\.$|\!"?\s+?|\!"?$|\?"?\s+?|\?"?$|\."\s+?|\."$|…"\s+?|…"?$)
这是匹配各种行尾位和拆分句子/段落。它做得很好。
但是,鉴于这句话:
Hello, Dr. Smith. How are you?
我想把它分成:
Hello, Dr. Smith.
How are you?
我现有的解决方案会产生类似的东西:
Hello, Dr.
Smith.
How are you?
有一整套(负面)匹配的称呼:
Dr.|Prof.|Mr.|Mrs.|Ms.
任何想法如何做到这一点?