0

OpenNLP(Java 中)无法识别格式为“2010 年 1 月 10 日”或“2010 年 1 月 10 日”的日期。在使用 OpenNLP 标记器之前,我将文本中的所有 ',' 替换为空字符串“”,它适用于“2010 年 1 月 10 日”形式的日期。因此,我尝试将“th”替换为“,”,但没有成功。我们如何确保上述表格的日期与 OpenNLP 一致?

提前致谢

4

1 回答 1

0

有关日期查找和格式的说明,这篇较新的帖子效果很好。因为它是一个统计模型,所以它讨论了在它周围的标记上下文中识别日期的模型。

对于上面的 th 情况,正如评论所说,如果你想同时替换 th 和 the ,那么你必须应用两个替换,或者更好的是用空字符串对 th 进行一次替换。

于 2014-03-13T16:34:07.420 回答