我需要一个从文本文件中提取句子的正则表达式。示例文本:
以 2004 年底发生的亚洲海啸灾难为例。在一个月内(1 月 17 日),对 Google 新闻 (http://news.google.com) 的查询返回了 80,000 多篇关于此事件的在线新闻文章至 2005 年 2 月 17 日)。先生的资料 卡哈娜。
这是我的代码:
$re = '/(?<=[.!?]|[.!?][\'"])\s+/';
$sentences = preg_split($re, $text, -1, PREG_SPLIT_NO_EMPTY);
但是最后一句话还是分裂了information by mr.
,Kahana.
怎么解决?谢谢你 :)