4

我正在尝试使用 NLTK 命名实体标记器来识别各种命名实体。在《Natural Language Processing with Python 》一书中,他们提供了常用命名实体的列表(表 7.4,如果有人好奇的话),其中包括:DATE June, 2008-06-29 和 TIME 25 am, 1:30 pm 所以我得到的印象是这可以用 NLTK 的命名实体标记器来完成。

但是,当我运行标记器时,它似乎根本没有选择日期或时间,就像人或组织一样。NLTK 命名实体标记器是否不处理这些日期/时间情况,还是只选择特定的日期/时间格式?如果它不处理这些情况,是否有人知道可以处理的系统?还是创建我自己的唯一解决方案?

谢谢!

4

1 回答 1

10

您应该查看 NLTK 的 contrib 存储库 - 包含一个名为 timex.py 的模块或在此处下载: https ://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

从模块的第一行开始:

# 在文本中标记时间表达式的代码
于 2012-04-27T02:12:22.680 回答