我正在运行一个允许用户发表评论的网站,其中大多数人没有受过良好教育,无法使用正确的标点符号、大写字母等。
我正在寻找某种可以获取垃圾文本并使其看起来不错的功能。
例如:
- 之前:这是一个测试。我喜欢馅饼
- 之后:这是一个测试。我喜欢馅饼。
- 之前:CAPS LOCK 是 COOL 的巡航控制。
- 之后:大写锁定是酷的巡航控制。
sentenceNormalizer是我唯一找到的,但是太简单了。它使所有不遵循 . !? 小写,不管它是“我”,一个人的名字,实际上是故意大写的,或者其他任何东西。
我正在运行一个允许用户发表评论的网站,其中大多数人没有受过良好教育,无法使用正确的标点符号、大写字母等。
我正在寻找某种可以获取垃圾文本并使其看起来不错的功能。
例如:
sentenceNormalizer是我唯一找到的,但是太简单了。它使所有不遵循 . !? 小写,不管它是“我”,一个人的名字,实际上是故意大写的,或者其他任何东西。