1

我必须为分隔的句子划分文本。

行。看起来很简单。

只需搜索“。” 或者 ”?” 或者 ”!” 并将下一句添加到数组中。

但不幸的是不是那么伟大和简单。

如何避免以下情况:

华盛顿特区

将被拆分为:“Washington, D”和“C”。

或者

“有一次,我们在老师瑟曼夫人的椅子下引爆炸药。”

分为:

“有一次我们在老师的椅子下引爆炸药,夫人”

“瑟曼”

也许是带有包含“。”的首字母缩略词的数据库。?

提前感谢您的提示!

4

1 回答 1

0

查看NLTK。它为您描述的问题提供了开箱即用的解决方案

于 2012-06-27T11:04:28.567 回答